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□ L3 LI and L2 70 

□ L2 cancerS or neoplasS or angiogen$ or tumor$ 1 84538 

□ LI hipl or (huntington adj interacting adj protein) 81 
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GenCore version 5.1.6 
Copyright (c) 1993 - 2006 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 
Run on : 



Title: 

Perfect score: 
Sequence : 



January 10, 2006, 11:00:20 ; Search time 14682 Seconds 

(without alignments) 
17554.026 Million cell updates/sec 

US-10-007-047-1 
4534 

1 ccaagcttggtacccccggg gcatgcnntagagggcccta 4534 



Scoring table: OLIGO_NUC 

Gapop 60.0 , Gapext 60.0 



Searched: 
Word size 



5883141 seqs, 28421725653 residues 



Total number of hits satisfying chosen parameters: 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Listing first 45 summaries 



11766282 



Database 



GenEmbl : * 



1 
2 
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7 
8 
9 

10 
11 
12 
13 
14 
15 



gb_ba : * 
gb_in : * 
gb_env: * 
gb_om: * 
gb_ov: * 
gb_pat : * 
gb_ph : * 
gb_p r : * 
gb_ro : * 
gb__sts : * 
gb_sy : * 
gb_un : * 
gb_vi : * 
gb_htg: * 
gb_pl : * 



Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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Result Query 

No. Score Match Length DB ID 



Description 



1 3035 66.9 4714 8 HSU79734 

2 3035 66.9 6626 6 AX828392 



U79734 Human hunti 
AX828392 Sequence 
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RESULT 1 
HSU79734 
LOCUS 

DEFINITION 

ACCESSION 

VERSION 

KEYWORDS 

SOURCE 

ORGANISM 



HSU79734 4714 bp mRNA linear PRI 06-MAY-1997 

Human huntingtin interacting protein (HIP1) mRNA, complete cds . 
U79734 

U79734.1 GI:2072422 



Homo sapiens 
Homo sapiens 



(human) 



Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 
Mammalia; Eutheria; Euarchontoglires ; Primates; Catarrhini; 
Hominidae; Homo. 
REFERENCE 1 (bases 1 to 4714) 

AUTHORS Kalchman,M.A. , Koide,H.B., McCutcheon, K . , Graham, R.K., Nichol,K., 
Nishiyama, K. , Kazemi-Es f ar j ani , P. , Lynn, F.C. , Wellington, C . , 
Metzler,M., Goldberg, Y . P . , Kanazawa,I., Geitz,R.D. and Hayden,M.R. 
TITLE HIP1, a human homologue of S. cerevisiae Sla2p, interacts with 

membrane-associated huntingtin in the brain 
JOURNAL Nat. Genet. 16 (1), 44-53 (1997) 
PUBMED 9140394 
REFERENCE 2 (bases 1 to 4714) 

AUTHORS Kalchman,M.A. , Nichol,K., Graham,R.K., Geitz,R.D. and Hayden,M.R. 
TITLE Direct Submission 

JOURNAL Submitted ( 24-NOV-1996) Medical Genetics, University of British 

Columbia, #416-2125 East Mall, NCE Building, Vancouver, BC V6T 1Z4, 
Canada 

FEATURES Location/Qualifiers 
source 1. .4714 

/organism="Homo sapiens" 

/mol_type="mRNA" 

/db_xref="taxon: 9606" 

/chromosome="7 " 

/map="7qll.2" 
gene 1. .4714 

/gene="HIPl" 
CDS 245. .2989 

/gene="HIPl" 

/note="putative orf; similar to SLA2 Saccharomyces 
cerevisiae, encoded by Genbank Accession Number Z22811, 
and ZK370.3 protein in Caenorhabditis elegans, encoded by 
Genbank Accession Number M98552" 
/codon_start=l 

/product="huntingtin interacting protein 1" 
/protein_id="AAC51257 . 1" 
/db_xref ="GI : 2072423" 

/ translation="MSRMWGHLSEGYGQLCSIYLKLLRTKMEYHTKNPRFPGNLQMSD 
RQLDEAGESDVNNFFQLTVEMFDYLECELNLFQTVFNSLDMSRSVSVTAAGQCRLAPL 
IQVILDCSHLYDYTVKLLFKLHSCLPADTLQGHRDRFMEQFTKLKDLFYRSSNLQYFK 
RLIQIPQLPENPPNFLRASALSEHISPVWI PAEASSPDSEPVLEKDDLMDMDASQQN 
LFDNKFDDIFGSSFSSDPFNFNSQNGVNKDEKDHLIERLYREISGLKAQLENMKTESQ 
RWLQLKGHVSELEADLAEQQHLRQQAADDCEFLRAELDELRRQREDTEKAQRSLSEI 
ERKAQANEQRYSKLKEKYSELVQNHADLLRKNAEVTKQVSMARQAQVDLEREKKELED 
SLERISDQGQRKTQEQLEVLESLKQELATSQRELQVLQGSLETSAQSEANWAAEFAEL 
EKERDSLVSGAAHREEELSALRKELQDTQLKLASTEESMCQLAKDQRKMLLVGSRKAA 
EQVIQDALNQLEEPPLISCAGSADHLLSTVTSISSCIEQLEKSWSQYLACPEDISGLL 
HSITLLAHLTSDAIAHGATTCLRAPPEPADSLTEACKQYGRETLAYLASLEEEGSLEN 
ADSTAMRNCLSKIKAIGEELLPRGLDIKQEELGDLVDKEMAATSAAIETATARIEEML 
SKSRAGDTGVKLEVNERILGCCTSLMQAIQVLIVASKDLQREIVESGRGTASPKEFYA 
KNSRWTEGLISASKAVGWGATVMVDAADLWQGRGKFEELMVCSHEIAASTAQLVAAS 
KVKADKDSPNLAQLQQASRGVNQATAGWASTISGKSQIEETDNMDFSSMTLTQIKRQ 
EMDSQVRVLELENELQKERQKLGELRKKHYELAGVAEGWEEGTEASPPTLQEWTEKE 

IT 

ORIGIN 



Query Match 66.9%; Score 3035; DB 8; Length 4714; 

Best Local Similarity 99.9%; Pred. No. 0; 



Matches 3135; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 



Qy 183 CAG CAT CAATAAGGC CATTAAT AC GCAGGAAGT GGCT GTAAAG GAAAAACACG C CAGAAC 242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I 
Db 1 CAG CAT CAATAAGG CCATTAATAC GCAGGAAGT GGCT GTAAAG GAAAAACAC G C CAGAAC 60 

Qy 243 GTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCG 302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 GT G CAT ACT G GG CAC C C AC CAT GAGAAAG G G G CACAGAC C T T CT GGT CT GT T GT CAAC CG 120 

Qy 303 CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 180 

Qy 363 C CT CC GAGAT GGACAC C C GAAC GT C CTGAAG GAC T CT CT GAGAT ACAGAAAT GAATT GAG 422 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I II I I I I I I I I I I I I 
Db 181 CCT CC GAGAT GGACAC CC GAAC GT C CTGAAG GAC T CT CT GAGATACAGAAAT GAATT GAG 240 

Qy 423 TGACATGAGCAGGATGTGGGGCTACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTA 482 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 TGACATGAGCAGGATGTGGGGCCACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTA 300 

Qy 4 83 CCTGAAACTGCTAAGAACCAAGATGGAGTACCACACCAAAAATCCCAGGTTCCCAGGCAA 542 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CCT GAAACT GCT AAG AAC C AAGAT G GAGT AC CAC AC C AAAAAT C C CAG GT T C C CAG G CAA 360 

Qy 54 3 CCTGCAGATGAGTGACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTTTC 602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 C CT G CAGAT GAGT GAC C GC CAGCT G GAC GAG G CT G GAGAAAGT GAC GT GAAC AACT T T T T 420 

Qy 603 CCAGTTAACAGTGGAGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACAGT 662 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 C CAGT TAAC AGT G GAGAT GTT T GACT AC CT G GAGT GT GAACT CAAC CT CT T C CAAAC AGT 4 80 

Qy 663 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 722 

I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 54 0 

Qy 723 CGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCT 7 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCT 600 

Qy 7 83 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 842 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 601 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 660 

Qy 843 CAT G GAG C AGTT T ACAAAGTT GAAAGAT C T GT T CT AC C G CT C C AGCAAC CT GCAGT ACT T 902 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CAT GGAGCAGTTTACAAAGTT GAAAGAT CT GTT CTACCGCTCCAGCAACCTGCAGTACTT 720 

Qy 903 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 9 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 780 

Qy 963 AGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGA 1022 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGA 840 



Qy 

Db 



1023 CAG CGAG C C AGT C CT AGAGAAG GAT GAC CT CAT G GACAT G GAT GCCTCT CAG CAGAAT T T 1082 
I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I i I I I I I I I II I I I I I I I I I I I I I I 
841 CAGCGAGC C AGT C CT AGAGAAG GAT GAC CT CAT G GACAT G GAT G CCT CT CAG CAGAAT T T 900 



Qy 1083 AT T T GACAACAAGTT T GAT GACAT CT T T GG CAGT T CATT CAGC AGT GAT C C CTT CAAT TT 1142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 901 ATTTGACAACAAGTTTGATGACATCTTTGGCAGTTCATTCAGCAGTGATCCCTTCAATTT 960 

Qy 1143 C AACAGT CAAAAT G GT GT GAACAAGGAT GAGAAGGAC CACT TAATT GAG C GACTATACAG 1202 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 961 C AACAGT CAAAATGGT GTGAACAAGGAT GAGAAGGAC CACTTAATT GAGCGACTATACAG 1020 

Qy 1203 AGAGAT CAGT GGATT GAAGGCACAGCTAGAAAACATGAAGACTGAGAGCCAGCGGGTT GT 12 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 AGAGAT CAGT GGATT GAAGGCACAGCTAGAAAACATGAAGACTGAGAGCCAGCGGGTT GT 1080 

Qy 1263 G CT G C AGC T GAAG G G C CAC GT CAG C GAG CT G GAAG CAGAT CT GG C C GAGC AGCAG CAC CT 1322 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCT GC AGCT GAAGG GC CAC GT CAG C GAG CT G GAAG CAGAT CT GG C C GAGCAGCAG CAC C T 114 0 

Qy 132 3 GC G GCAG CAG GC GG C C GAC GACT GT GAATT CCTGCGGG C AGAACT G GAC GAGCT CAGGAG 1382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1141 GCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAG 1200 

Qy 1383 G C AGC G G GAG GACAC C GAGAAGGCT CAG C G GAG CC T GT CT GAGAT AGAAAG GAAAG CT CA 1442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 G C AGC G G GAG GACAC C GAGAAG GCT CAG C G GAG C C T GT CT GAGAT AGAAAG GAAAG CT CA 1260 

Qy 1443 AGC CAAT GAACAGC GAT ATAGCAAG C TAAAG GAGAAGT AC AGCGAG CT G GT T CAGAAC C A 1502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 AGC CAAT GAACAGCGATATAGCAAGCTAAAGGAGAAGTACAGCGAGCT GGTTCAGAAC CA 1320 

Qy 1503 CGCTGACCTGCTGCGGAAGAATGCAGAGGTGACCAAACAGGTGTCCATGGCCAGACAAGC 1562 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I 
Db 1321 C GCT GAC CT G CT G C G GAAGAAT G CAGAG GT GAC C AAACAG GT GT C CAT G GC CAGACAAG C 1380 

Qy 1563 C CAG GT AGAT T T GGAAC GAGAGAAAAAAGAG CT GGAG GAT T C GT T G GAG CGCAT CAGT GA 1622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 C CAG GT AGAT TT G GAAC GAGAGAAAAAAGAG CT GGAG GAT T C GTT GGAG C GCAT CAGT GA 14 4 0 

Qy 1623 CCAGGGCCAGCGGAAGACTCAAGAACAGCTGGAAGTTCTAGAGAGCTTGAAGCAGGAACT 1682 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 C C AGG G C CAG C G GAAGACT C AAGAAC AG CT GGAAGT T C T AGAGAG CTT GAAG CAG GAACT 1500 

Qy 1683 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 1501 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1560 

Qy 1743 AGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTGAG 1802 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 AGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTGAG 1620 

Qy 1803 TGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACTCA 1862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 TGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACTCA 1680 



Qy 1863 GCT CAAACT G GC CAG C ACAGAGGAAT CTAT GT GC CAGCT TGCCAAAGAC CAAC GAAAAAT 1922 

I I I I I I I I I I I I I I I I II I I I I I I I I I I i I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCT CAAACT GGCCAGCACAGAGGAATCTATGTGCCAGCTTGCCAAAGAC CAAC GAAAAAT 1740 

Qy 1923 GCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAGCT 1982 

I I I I II I I I I I i I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 GCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAGCT 1800 

Qy 1983 TGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCAC 2042 

I II I I I I II I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 TGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCAC 1860 

Qy 2043 ATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGCCC 2102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 AT C C ATT T C CAG CT G CAT CGAGCAACT GGAGAAAAGC T GGAGC CAGT AT CTGGCCTGCCC 1920 

Qy 2103 AGAAGAC AT CAGT G GACT T CT C CATT C CATAAC CCTGCTGGCC CACT T GAC CAG C GAC G C 2162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 1921 AGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGACGC 1980 

Qy 2163 CATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTGAC 2222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 CATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTGAC 204 0 

Qy 2223 CGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGA 22 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 

Db 2041 CGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGA 2100 

Qy 2283 G G GAAG C CT T GAGAAT GC CGACAGCACAG C CAT GAGGAACT G C CT GAGCAAGAT CAAGG C 2342 

II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I 

Db 2101 G G GAAG C CT T GAGAAT G C C GAC AG C AC AG C CAT GAGGAAC T GC C T GAG C AAGAT CAAG G C 2160 

Qy 2343 CATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGACCT 2402 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 CATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGACCT 2220 

Qy 24 03 G GT G GACAAGGAGAT G GC GG CCACTT CAGCT G CT AT T GAAACT GC CACG GC C AGAAT AGA 24 62 

II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I 

Db 2221 G GT G GACAAG GAG AT GG C G G C CACTT CAGCT G CT AT T GAAACT GC CAC G GC C AGAAT AGA 2280 

Qy 24 63 GGAGAT GCT CAG CAAAT C C C GAGCAG GAGAC AC AG GAGT CAAATT GGAGGT GAAT GAAAG 2522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GGAGAT GCT CAG CAAAT C C C GAGCAG GAGAC ACAG GAGT CAAAT T G GAGGT GAAT GAAAG 2340 

Qy 2523 GATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCTAA 2582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCTAA 2400 

Qy 2583 GGACCTCCAGAGAGAGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTAAAGAGTTTTA 2 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 GGAC C T C CAGAGAGAGAT T GT G GAGAGC GGCAG G G GTAC AGCAT C C C CTAAAGAGT T TT A 2 4 60 

Qy 2 643 TGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGG 2702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2461 TGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGG 2520 

Qy 2703 AG C CAC T GT CAT G GT G GAT GCAGC T GAT CT GGT G GT ACAAG GCAGAGGGAAAT T T GAGGA 27 62 



Db 



2521 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AGC CACT GT CAT G GT GGAT G CAGCT GAT CT GGT GGTACAAG GCAGAG GGAAATTT GAG GA 2580 



Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



2763 GCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAA 2822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2581 GCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAA 2 64 0 

2823 GGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGT 2 882 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2641 GGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGT 2700 

2883 GAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAAGA 2942 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
27 01 GAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAAGA 2760 

2943 GACAGACAACAT GGACTT CT CAAGCAT GAC GCT GAC ACAGAT CAAAC GC CAAGAGAT GGA 3002 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
27 61 GACAGACAACAT G GACTT C T CAAG CAT GAC GCT GAC ACAGAT CAAAC GC CAAGAGAT G GA 2820 

3003 TTCTCAGGTTAGGGTGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTGGG 3062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2821 TTCTCAGGTTAGGGTGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTGGG 28 80 

3063 AGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAAC 3122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2881 AGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAAC 294 0 

3123 AGAG G CAT C T C CAC CT ACACT GCAAGAAGT G GTAAC C GAAAAAGAAT AGAG C CAAAC CAA 3182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2941 AGAGGC AT CT C CAC CTACACT G CAAGAAGT GGT AAC C GAAAAAGAAT AGAG C CAAAC CAA 3000 

3183 CACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGCCA 3242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3001 CACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGCCA 3060 

3243 CAGG C CAAAT C CT T G GAG.T C C CAG GG GCAG C CACAC CACT G C CAT TAC C CAGT G C C GAG G 3302 

I I I I I I I I I I I I I I I I I I I I I I II I I II I II I I I I I I I I I I I II II II I I I I I II I I I I I 
3061 CAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGAGG 3120 

3303 ACAT GCAT GACACTT CC 3319 

I I I I I I I I I I I I I I I I I 
3121 ACAT G CAT GAC AC T T C C 3137 
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Qy 183 C AG CAT CAAT AAG G C C ATT AAT AC G C AG GAAGT G GCT GT AAAG GAAAAAC AC G C CAGAAC 242 

I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 

Db 1 CAGCAT CAAT AAG GC CATTAAT AC GCAG GAAGT GG CT GTAAAGGAAAAACAC GC CAGAAC 60 

Qy 243 GTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCG 302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 

Db 61 GTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCG 120 

Qy 303 CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 362 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 121 CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 180 

Qy 363 C CT C CGAGAT G GACACC C GAAC GT C C T GAAG GACT CT CT GAGAT ACAGAAAT GAAT T GAG 422 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 181 C C T C CGAGAT GGACACC C GAAC GT C C T GAAG GACT CT CT GAGAT ACAGAAAT GAAT TGAG 240 

Qy 423 T GACAT GAG CAG GAT GT G G G GCTAC CT GAG C GAGG GGT AT GGC C AG CT GT G CAG CAT C T A 482 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

Db 241 TGACATGAGCAGGATGTGGGGCCACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTA 300 

Qy 4 83 C C T GAAACT G CTAAGAAC CAAGAT G GAGTACCAC AC CAAAAAT C C CAG GT T C C CAG GCAA 542 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 C C T G AAA C T G C T AAG AA C CAAGAT G GAG T AC C A C AC CAAAAAT C C CAG G T T C C CAG G C AA 360 

Qy 543 C CT G CAGAT GAGT GAC C GC CAG CT G GAC GAGG CT G GAGAAAGT GAC GT GAACAACT TT T C 602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 361 CCTGCAGATGAGTGACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTTTT 420 

Qy 603 C C AGT TAACAGT G G AGAT GT T T GACT AC CT GGAGT GT GAAC T CAAC CT C T T C CAAAC AGT 662 

I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 C CAGT TAACAGT G GAGAT GTTT GACTAC CT GGAGT GT GAACT CAACCT CTT CCAAACAGT 4 80 

Qy 663 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 4 81 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 54 0 

Qy 723 CGC C CC GCT GAT C CAGGT CAT CTT GGACT G CAGC C AC C T TTAT GACT AC ACT GT CAAG CT 782 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 541 CGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCT 600 

Qy 783 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 842 



Db 



I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

601 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 660 



Qy 843 CATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTACTT 902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I II I I I I I I I II I I I I I I II II I I I 

Db 661 CATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTACTT 720 

Qy 903 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 962 

I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 721 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 780 

Qy 963 AGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGA 1022 

I I I I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 AG CC CT GT CAGAACAT AT C AG C C CT GT GGT GGT GAT C C CT G CAGAGGC C T CAT C C C CC GA 84 0 

Qy 1023 C AGC GAG C CAGT C CTAGAGAAG GAT GAC CT CAT GGACAT GGAT GC CT CT CAG CAGAATT T 1082 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 841 CAGCGAGCCAGT CCTAGAGAAGGATGACCT CATGGACAT GGAT GCCTCT CAGCAGAATTT 900 

Qy 10 83 ATTTGACAACAAGTTTGATGACATCTTTGGCAGTTCATTCAGCAGTGATCCCTTCAATTT 1142 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 AT T T GAC AAC AAGT T T GAT GAC AT CT T T GGC AGT T CAT T CAG CAGT GAT C C C T T CAAT TT 960 

Qy 1143 C AAC AGT CAAAAT GGT GT GAACAAG GAT GAGAAG GAC CACT TAAT T GAG C GACTAT ACAG 1202 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 961 CAACAGT CAAAAT GGT GT GAACAAGGAT GAGAAGGAC CACT TAATT GAGC GACTAT ACAG 1020 

Qy 1203 AGAGAT CAGT G GATT GAAG G CACAG CT AGAAAACAT GAAGACT GAGAGC CAG C G GGT T GT 12 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1021 AGAGAT CAGT G GAT T GAAGGCACAG CT AGAAAACAT GAAGACT GAGAG C C AGCG GGTT GT 1080 

Qy 1263 GCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCACCT 1322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 GCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCACCT 1140 

Qy 1323 GCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAG 1382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1141 GCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAG 1200 

Qy 1383 G CAG C G G GAG GAC AC C GAGAAG G C T CAG C G GAG C C T G T C T G AG AT A G AAAG GAAAG C T C A 1442 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 GCAG CG G GAG GACAC C GAGAAG G CT CAG CG GAG C CT GT CT GAGAT AGAAAG GAAAG CT CA 1260 

Qy 1443 AG C CAAT GAAC AG C GAT AT AG CAAGCTAAAGGAGAAGT AC AGC GAG CT G GT T CAGAAC C A 1502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 AG C CAAT GAACAG C GAT AT AG CAAGCTAAAGGAGAAGTAC AG C GAG CT GGTT CAGAAC CA 1320 

Qy 1503 C G CT GAC C T GCT G CGGAAGAAT G CAGAG GT GAC CAAAC AGGT GT C CAT GGC CAGACAAGC 1562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1321 C G CT GAC C T GC T G CG GAAGAAT G CAGAG GT GAC CAAACAGGT GT C CAT G GCCAGACAAG C 1380 

Qy 1563 CCAGGTAGATTTGGAACGAGAGAAAAAAGAGCTGGAGGATTCGTTGGAGCGCATCAGTGA 1622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 C CAG GT AGAT TT G GAAC GAGAGAAAAAAGAG C T G GAG GATT C GT T GGAGC GCAT CAGT GA 144 0 

Qy 1623 C CAG GGC CAG C GGAAGACT CAAGAACAGCT G GAAGT T CT AGAGAG CT T GAAG CAG GAAC T 1682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 1441 CCAG GG C CAG C GGAAGACT CAAGAACAGCT G GAAGTT CTAGAGAGCTT GAAG CAG GAACT 1500 

Qy 1683 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 1 I I I I I I I I I I I I I I I 

Db 1501 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1560 

Qy 174 3 AGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTGAG 1802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1561 AGAAG CAAACT G GG CAG C C GAGT T C GCC GAG CT AGAGAAG GAGC GGGACAG C CT GGT GAG 1620 

Qy 1803 TGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACTCA 1862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 TGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACTCA 1680 

Qy 18 63 GCT CAAACT GG C CAGCACAGAGGAAT CT AT GT G CC AGC T T GC CAAAGAC CAAC GAAAAAT 1922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 GCT CAAACT GG C CAGCACAGAG GAAT CT AT GT GC CAG CT T GC CAAAGAC CAACGAAAAAT 174 0 

Qy 1923 GCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAGCT 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 17 41 GCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAGCT 18 00 

Qy 1983 TGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCAC 2042 

I I I I I I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 

Db 1801 TGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCAC 18 60 

Qy 2043 ATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGCCC 2102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 18 61 ATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGCCC 1920 

Qy 2103 AGAAGACAT CAGT G GACT T CT C CAT T CCATAAC CCTGCTGGCC C ACT T GAC C AGC GAC G C 2162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1921 AGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGACGC 1980 

Qy 2163 CATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTGAC 2222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1981 C ATT G CT CAT G GT G C CAC CAC CT GC CT CAGAG C CC CAC CT GAG C CT GC C GACT CAC T GAC 204 0 

Qy 2223 CGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGA 2282 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2 041 CGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGA 2100 

Qy 2283 G G G AAG C C T T GAG AAT GCC GAC AG CAC AG C CAT GAG GAAC T G C C T GAG C AAGAT C AAG G C 2342 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2101 GG GAAGC CT T GAGAAT GCC GACAGCACAGC C AT GAG GAACT G C CT GAG CAAGAT CAAG G C 2160 

Qy 2343 CATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGACCT 24 02 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2161 CATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGACCT 222 0 

Qy 2403 GGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATAGA 2462 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2221 G GT G GACAAG GAGAT G G C G G C CAC T T CAG C T G CT AT T GAAACT G C CAC GG C CAGAAT AGA 2280 

Qy 2463 GGAGAT GCT CAGCAAAT CCCGAGCAGGAGACACAGGAGTCAAATT GGAGGT GAAT GAAAG 2522 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 GGAGAT GCT CAG CAAAT C C C GAG CAG GAG AC AC AG GAGT C AAAT T G GAG GT GAAT GAAAG 234 0 



Qy 2523 GATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCTAA 2582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2341 GATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCTAA 24 00 

Qy 2583 G GAC CTC CAGAGAGAGATT GT G GAGAG C GG CAGG GGT AC AGC AT C C C CTAAAGAGTT TTA 2 642 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 2401 GGACCTCCAGAGAGAGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTAAAGAGTTTTA 24 60 

Qy 2643 TGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGG 2702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2461 TGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGG 2520 

Qy 2703 AGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAGGA 27 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I 
Db 2521 AG C CACT GT CAT GGT G GAT G CAGCT GAT CT GGT G GT ACAAGG CAGAGG GAAAT TT GAGGA 2580 

Qy 2763 GCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAA 2822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 GCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAA 2640 

Qy 2823 GGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGT 28 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 2641 GGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGT 27 00 

Qy 2883 GAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAAGA 2942 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I I I II I I I I I I I I I I I I 
Db 27 01 GAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAAGA 27 60 

Qy 2943 GAC AG AC AAC AT G GAC T T CT C AAG CAT GAC GC T GAC AC AGAT C AAAC GC C AAGAGAT G GA 3002 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I I 
Db 27 61 GAC AGACAACAT G GACTT CT CAAG CAT GAC GCT GACACAGAT CAAAC G C CAAGAGAT GGA 2820 

Qy 3003 TTCTCAGGTTAGGGTGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTGGG 3062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 
Db 2821 T T CT CAG GT TAGGGT G CT AGAG CTAGAAAATGAATT GC AGAAG GAG C GT CAAAAACT GG G 2880 

Qy 3063 AGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAAC 3122 

M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2881 AGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAAC 2940 

Qy 3123 AG AGG CATCT C CAC CT ACACT G CAAGAAGT GGTAAC C GAAAAAGAATAGAGCCAAAC CAA 3182 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 2 941 AG AGG CAT CT C CAC CT ACACT G CAAGAAGT G GTAAC C GAAAAAGAAT AGAG C CAAAC CAA 3000 

Qy 3183 CACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGCCA 3242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 CACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGCCA 3060 

Qy 3243 CAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGAGG 3302 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 CAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGAGG 3120 

Qy 3303 AC AT G CAT GAC AC T T C C 3319 

I I II I I I I I I I I I I II I 
Db 3121 ACAT G CAT GACACT T C C 3137 
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ORIGIN 
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Matches 3178; Conservative 0; Mismatches 3; Indels 0; Gaps 0; 

C AG CAT C AAT AAG G C CAT T AAT AC G C AGGAAGT G G CT GT AAAG GAAAAAC AC G C C AGAAC 2 42 
I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAG CAT CAAT AAG G C CATTAAT AC GCAG GAAGT GG C T GT AAAG GAAAAACAC GC CAGAAC 6 0 

GTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCG 302 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
GTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCG 120 

CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 362 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 180 

C CT C C GAGAT G G AC AC C C GAAC GT CCT GAAGGAC T CT CT GAGAT AC AGAAAT GAATT GAG 422 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C CT C C GAGAT GGACAC C C GAAC GT C C T GAAGGACT C T CT GAGAT AC AGAAAT GAATT GAG 2 40 

TGACATGAGCAGGATGTGGGGCTACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTA 4 82 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
TGACATGAGCAGGATGTGGGGCCACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTA 300 

CCTGAAACTGCTAAGAACCAAGATGGAGTACCACACCAAAAATCCCAGGTTCCCAGGCAA 542 
I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
C CT GAAACT GCTAAGAAC CAAGAT GGAGTAC CACACCAAAAAT CC CAGGTT CCCAGGCAA 360 

C CT G CAGAT GAGT GAC C G C C AG CT G GAC GAG G CT G GAGAAAGT GAC GTGAACAACT T T T C 602 
I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
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Db 

Qy 

Db 

Qy 
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Qy 
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Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
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361 CCTGCAGATGAGTGACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTTTT 420 

603 CCAGTTAACAGTGGAGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACAGT 662 

I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
421 CCAGTTAACAGTGGAGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACAGT 4 80 

663 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 

4 81 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 54 0 

723 CGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCT 7 82 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I I I I I I I 
541 CGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCT 600 

783 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
601 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 660 

843 CATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTACTT 902 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
661 CATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTACTT 720 

903 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 962 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
721 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 7 80 

963 AGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGA 1022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
7 81 AGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGA 84 0 

1023 CAG C GAG C CAGT C C T AGAGAAG GAT GAC C T CAT G GACAT G GAT GC CT CT CAGCAGAAT TT 1082 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
CAGCGAGCCAGT C CTAGAGAAGGATGACCT CAT GGACAT GGAT GC CT CT CAGCAGAATTT 



841 



900 



1083 AT T T GACAACAAGT T T GAT GACAT CT T T GGCAGT T CAT T CAG CAGT GAT C C CTT CAATT T 1142 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

AT T T GACAACAAGT T T GAT GACAT CT T T GGCAGT T CAT T CAG CAGT GAT CC C T T CAAT T T 



901 



960 



114 3 CAACAGT CAAAAT GGT GT GAACAAGGAT GAGAAGGAC CACTTAATTGAGCGACTATACAG 1202 
I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I I I I I I I I 

961 CAACAGT CAAAAT G GT GT GAACAAGGAT GAGAAGGAC C AC T T AAT T GAGC GAC T AT ACAG 102 0 

1203 AGAGAT CAGT GGATT GAAGGCACAGCTAGAAAACAT GAAGACT GAGAGC CAGCGGGTT GT 1262 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1021 AGAGAT CAGT GGAT T GAAG G CACAGC TAGAAAAC AT GAAGACT GAGAGC CAG C G G GT T GT 1080 

12 63 GCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCACCT 1322 

I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 GCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCACCT 114 0 

1323 GCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAG 1382 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1141 GCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAG 12 00 

1383 GCAGCGGGAGGACACCGAGAAGGCTCAGCGGAGCCTGTCTGAGATAGAAAGGAAAGCTCA 1442 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

12 01 G CAGC G G GAGGAC AC C GAGAAGGC T CAGCG GAG C CT GT CT GAGAT AGAAAGGAAAGCT C A 1260 



1443 AGCCAAT GAACAGC GATAT AG CAAGCTAAAGGAGAAGTACAGC GAG CT GGTT CAGAAC C A 1502 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I 1 I I I I I I I II I 
1261 AGC CAAT GAACAGC GAT AT AG CAAG CTAAAGGAGAAGT ACAGC GAG CT G GTT CAGAAC C A 1320 

1503 CGCTGACCTGCTGCGGAAGAATGCAGAGGTGACCAAACAGGTGTCCATGGCCAGACAAGC 1562 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I II 
1321 CGCTGACCTGCTGCGGAAGAATGCAGAGGTGACCAAACAGGTGTCCATGGCCAGACAAGC 1380 

1563 CCAGGTAGATTT GGAACGAGAGAAAAAAGAGCTGGAGGATTC GTTGGAGC GCATCAGT GA 1622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1381 C C AGGTAGAT TT GGAAC GAGAGAAAAAAGAGCT GGAGGAT T C GT T GGAG C GCAT C AGT GA 144 0 

1623 CCAGGGCCAGCGGAAGACTCAAGAACAGCTGGAAGTTCTAGAGAGCTTGAAGCAGGAACT 1682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1441 CCAGGGCCAGCGGAAGACTCAAGAACAGCTGGAAGTTCTAGAGAGCTTGAAGCAGGAACT 1500 

168 3 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1501 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1560 

174 3 AGAAG CAAACT G GGC AG C C GAGT T C G C C GAG CT AGAGAAG GAG C GG GACAG C C T G GT GAG 1802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
1561 AGAAG CAAACT G G G C AG C C GAGT T C G C C GAG CTAGAGAAGGAG C GGGAC AG C C T GGT GAG 1620 

1803 T GG CG CAG CT CAT AG G GAG GAGGAAT TAT CT G CT C TT C GGAAAGAACT G CAG GACACT C A 1862 

I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 TGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACTCA 168 0 

18 63 GCT CAAACT G GC CAG CACAGAG GAAT CT AT GT GC CAG CTT G C CAAAGAC CAAC GAAAAAT 1922 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1681 G CT CAAACT GGC C AGCACAGAG GAAT CTAT GT GC CAG CT T GC CAAAGAC CAAC GAAAAAT 174 0 

1923 GCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAGCT 1982 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1741 GCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAGCT 1800 

1983 TGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCAC 2 042 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1801 TGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCAC 18 60 

2043 ATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGCCC 2102 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
18 61 ATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGCCC 1920 

2103 AGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGACGC 2162 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I 
1921 AGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGACGC 1980 

2163 CATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTGAC 2222 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTGAC 204 0 

2223 CGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGA 22 82 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 CGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGA 2100 



Qy 2283 GGGAAGCCTTGAGAATGCCGACAGCACAGCCATGAGGAACTGCCTGAGCAAGATCAAGGC 2342 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 G GGAAG C CTT GAGAAT G C C GACAGCACAG C CAT GAGGAACT G CC T GAG CAAGAT CAAG GC 2160 

Qy 2343 CATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGACCT 24 02 

I I I I I I I I I I I I I I I I 1 I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2161 CATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGACCT 2220 

Qy 2403 G GT GGACAAG GAGAT G G CG G C CACTT CAG CT G CTATT GAAACT G CCAC GG C CAGAATAGA 24 62 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 GGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATAGA 2280 

Qy 24 63 GGAGAT G CT CAG CAAAT CC C GAG CAGGAGACAC AGGAGT CAAATT G GAGGT GAAT GAAAG 2522 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 22 81 GGAGAT G CT CAG CAAAT CC CGAG CAGGAGACAC AGGAGT CAAATT G GAG GT GAAT GAAAG 234 0 

Qy 2523 GATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCTAA 2582 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCTAA 24 00 

Qy 2583 GGAC CT C CAG AGAGAGAT T GT G GAGAG C G G CAG G G GT AC AG CAT C C C CT AAAGAGT T T T A 2 642 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 GGAC CT C C AGAGAGAG AT T GT G GAGAG C G G CAG G G GT ACAG CAT C C C CT AAAGAGT TT T A 24 60 

Qy 2643 TGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGG 2702 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 TGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGG 2520 

Qy 2703 AGC CAC T GT CAT G GT GGAT GCAG CT GAT CT G GT GGT ACAAGG C AGAGG GAAATTT GAGGA 27 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 AGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAGGA 2580 

Qy 2763 GCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAA 2822 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 GCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAA 2 64 0 

Qy 2823 GGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGT 2882 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GGTGAAAGCTGATAAGGACAGCCCTAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGT 27 00 

Qy 2 883 GAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAAGA 2 942 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 GAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAAGA 2760 

Qy 2 94 3 GACAGACAACAT GGAC T T C T CAAG CAT GAC G CT GACACAGAT CAAAC G C CAAGAGAT G GA 3002 

I I I I I I I I I I I.I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I 
Db 27 61 GACAGACAACAT G GAC T T C T CAAG CAT GAC G CT GACACAGAT C AAAC GC CAAGAGAT G GA 282 0 

Qy 3003 TTCTCAGGTTAGGGTGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTGGG 3062 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 
Db 2821 T T C T CAG GT TAG GGT G CTAGAG CTAGAAAAT GAAT T G CAGAAGGAG C GT CAAAAAC T G G G 2880 

Qy 3063 AGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAAC 3122 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 881 AGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAAC 294 0 

Qy 3123 AGAG G CAT CT C CAC C T AC ACT G CAAGAAGT G GT AAC C GAAAAAGAAT AGAG C CAAAC C AA 3182 



Db 



2941 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 11 I I I I I I I I I I I I I I I I 

AGAGGCATCTCCACCTACACTGCAAGAAGTGGTAACCGAAAAAGAATAGAGCCAAACCAA 3000 



Qy 3183 CAC CC CATAT GT CAGT GTAAAT C CT T GT TAC CTAT CT CGT GT GT GT TATTT C C CCAG C CA 3242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 3001 CACCC CATAT GTCAGTGTAAATCCTTGTTACCTATCT CGT GTGTGTTATTTCCCCAGCCA 3060 

Qy 3243 CAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGAGG 3302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 CAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGAGG 3120 

Qy 3303 ACATGCATGACACTTCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACCCATG 3362 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 ACAT G CAT GACACT T C CAAAGACT C C CT C C ATAGC GACAC C CTTT CT GTT T GGAC C CAT G 3180 

Qy 3363 G 3363 

I 

Db 3181 G 3181 
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ALIGNMENTS 



RESULT 1 
ACC85533 

ID ACC85533 standard; DNA; 4534 BP. 
XX 

AC ACC85533; 
XX 

DT 15-OCT-2003 (first entry) 
XX 

DE Human HIP1 cancer marker coding sequence. 
XX 

KW Human; HIP1; cancer; cancer marker; epithelial cancer; cytostatic; gene; 

KW ds . 

XX 

OS Homo sapiens. 
XX 

PN WO2003043566-A2. 
XX 

PD 30-MAY-2003. 
XX 

PF 12-NOV-2002; 2002WO-US036175 . 
XX 

PR 15-NOV-2001; 2001US-033527 6P . 

PR 06-DEC-2001; 2001US-00007047 . 
XX 

PA (UNMI ) UN IV MICHIGAN. 

XX 

PI Ross T, Mizukami I, Roa D; 

XX 

DR WPI; 2003-457565/43. 
XX 

PT New antibody binding to HIP1 but not to normal epithelium, useful for 

PT diagnosing and treating epithelial cancers, particularly colon and 

PT prostate cancer. 
XX 

PS Disclosure; Fig 7; 143pp; English. 
XX 

CC The present invention relates to an antibody that specifically binds to 

CC HIP1 but does not specifically bind to the normal epithelium of prostate 

CC or colon. The antibody can be used for diagnosing and treating epithelial 

CC cancers, particularly colon and prostate cancer. The present sequence is 

CC the human HIP1 coding sequence 
XX 

SQ Sequence 4534 BP; 1176 A; 1230 C; 1232 G; 894 T; 0 U; 2 Other; 

Query Match 100.0%; Score 4534; DB 10; Length 4534; 
Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4534; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 



1 CCAAGCTTGGTACCCCCGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATG 60 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 1 CCAAGCTTGGTACCCCCGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATG 60 

Qy 61 GATCGGATGGCCAGCTCCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGG 120 

I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I 

Db 61 GATCGGATGGCCAGCTCCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGG 120 

Qy 121 CGCGGGGTCGGCGCTGGGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CGCGGGGTCGGCGCTGGGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACT 180 

Qy 181 GT CAGCAT CAATAAGGC CAT TAAT AC GCAGGAAGT G G CT GTAAAG GAAAAACAC GC CAGA 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I II I I II 
Db 181 GT CAGCAT CAATAAGGC CAT TAAT AC GCAGGAAGT G GCT GTAAAG GAAAAACAC GC CAGA 240 

Qy 241 ACGTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAAC 300 

I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 241 ACGTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAAC 300 

Qy 301 CGCCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAA 3 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 CGCCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAA 360 

Qy 361 CT CCT C C GAGAT G GACAC C C GAAC GT CC T GAAGGACT CT CT GAGAT ACAGAAAT GAAT T G 420 

I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CT C CT C C GAGAT G GACAC C C GAAC GT C C T GAAG GACT C T CT GAGAT ACAGAAAT GAAT T G 42 0 

Qy 421 AGTGACATGAGCAGGATGTGGGGCTACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATC 4 80 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 421 AGT GAC AT GAG C AG GAT GT G G G G C T AC CT GAG C GAG G G GT AT G G C C AG CT GT G C AG CAT C 480 

Qy 4 81 T AC CT GAAACT GC TAAGAAC CAAGAT GGAGTAC C ACAC CAAAAAT C C CAG GT T C CC AG GC 54 0 

I II I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
Db 4 81 T AC CT GAAACT GC TAAGAAC CAAGAT GGAGTAC CACAC CAAAAAT C C CAG GT T C CCAG G C 54 0 

Qy 541 AAC CT G CAGAT GAGT GAC C GC CAGCT GGAC GAG GCT GGAGAAAGT GAC GT GAACAACT T T 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AACCTGCAGATGAGTGACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTT 600 

Qy 601 T C C C AGTTAACAGT G GAGAT GT T T GACTAC CT G GAGT GT GAAC T CAAC C T CTT C CAAACA 660 

I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 T C C CAGTTAACAGT G GAGAT GT TT GACTAC C T G GAGT GT GAAC T CAAC C T CTT C CAAACA 660 

Qy 661 GTATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGC 720 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 GTATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGC 720 

Qy 721 CTCGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAG 780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCGCCCCGCT GAT C CAGGT CAT C T T G GACT GCAG C C AC C T TT AT GACT ACACT GT CAAG 780 

Qy 781 CTTCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CTTCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGC 840 

Qy 841 T T CAT G GAG CAGT T TACAAAGT T GAAAGATCTGTTCTACC GCT CCAG CAAC CTG CAG T AC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 841 TTCATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTAC 900 

Qy 901 TTCAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 901 TTCAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCC 960 

Qy 961 TCAGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCAGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCC 1020 

Qy 1021 GACAGCGAGCCAGTCCTAGAGAAGGATGACCTCATGGACATGGATGCCTCTCAGCAGAAT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 

Db 1021 GACAGCGAGCCAGTCCTAGAGAAGGATGACCTCATGGACATGGATGCCTCTCAGCAGAAT 1080 

Qy 1081 TTATTTGACAACAAGTTTGATGACATCTTTGGCAGTTCATTCAGCAGTGATCCCTTCAAT 1140 

I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 T TATT T GACAACAAGT TT GAT GACAT CT T T G G CAGT T CAT T CAG CAGT GAT C C CT T CAAT 1140 

Qy 1141 TT CAACAGT CAAAAT GGT GT GAACAAGGAT GAGAAGGAC CACTTAATTGAGCGACTATAC 1200 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 1141 T T CAACAGT CAAAAT GGT GT GAACAAGGAT GAGAAG GAC C ACT TAAT T GAG C GACTATAC 1200 

Qy 1201 AGAGAGAT CAGT GGAT T GAAG G CAC AG C TAGAAAAC AT GAAGACT GAGAG C CAG C G G GT T 1260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGAGAGAT C AGT G GAT T GAAG GCACAG CT AGAAAACAT GAAGAC T GAGAG C C AGC GG GT T 12 60 

Qy 1261 GTGCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1261 GTGCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCAC 1320 

Qy 1321 CTGCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGG 1380 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CTGCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGG 1380 

Qy 1381 AG G CAG C G G GAG GAC AC C GAGAAG G C T CAG C G GAG C C T GT C T G AG AT AG AAAG GAAAG C T 1440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 AG G CAGC G G GAG GAC AC C GAGAAGG C T C AGC G GAG C CT GT CT GAGAT AGAAAGGAAAG CT 144 0 

Qy 14 41 CAAGCCAATGAACAGCGATATAGCAAGCTAAAGGAGAAGTACAGCGAGCTGGTTCAGAAC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 CAAG C CAAT GAACAG C GATATAG CAAG CTAAAGGAGAAGT ACAG C GAG CT GGT T CAGAAC 1500 

Qy 1501 CAC G C T GAC CTGCTGCG G AAG AAT G CAG AG G T GAC C AAAC AG G T G T C CAT G G C C AG AC AA 1560 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I I I I 
Db 1501 CAC G CT GAC C T G CT GC GGAAGAAT GCAGAGGT GAC CAAAC AG GT GT C CAT GG C CAGACAA 1560 

Qy 1561 G C C CAG G TAG AT T T G GAAC GAG AGAAAAAAG AG C T G GAG GAT T C GT T G GAG C G CAT CAGT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1561 G C C CAGGT AGATT T GGAAC GAGAGAAAAAAGAG CT G GAGGAT T C GT T G GAGC GCAT CAGT 1620 

Qy 1621 GACCAG G G C CAG C G GAAGACT CAAGAACAG CT G GAAGT T CT AGAGAG CT T GAAGCAGGAA 168 0 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1621 GAC CAG GG C CAG C GGAAGACT CAAGAACAG CT GGAAGT T CT AGAGAGCTT GAAG CAG GAA 168 0 

Qy 1681 CTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAG 174 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1681 CTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAG 1740 



Qy 1741 TCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTG 1800 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 1 I I I I 1 I I I I I I I I I I I I I I I I I I I I I I 
Db 17 41 TCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTG 1800 

Qy 1801 AGTGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACT 1860 

I I II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1801 AGT GG C G CAG CT CATAG GGAG GAG GAATTAT CT G CT CTT C GGAAAGAACT GC AGGACACT 1860 

Qy 1861 CAGCTCAAACTGGCCAGCACAGAGGAATCTATGTGCCAGCTTGCCAAAGACCAACGAAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CAGCTCAAACTGGCCAGCACAGAGGAATCTATGTGCCAGCTTGCCAAAGACCAACGAAAA 1920 

Qy 1921 ATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAG 1980 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 ATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAG 1980 

Qy 1981 CTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 CTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTC 204 0 

Qy 2041 ACATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGC 2100 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2041 ACATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGC 2100 

Qy 2101 CCAGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 2101 CCAGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGAC 2160 

Qy 2161 GCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTG 2220 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2161 GCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTG 2220 

Qy 2221 ACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2221 ACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAA 22 80 

Qy 22 81 GAG GGAAG C C TT GAGAAT GC C GACAG CACAG C CAT GAG GAACT G C CT GAGCAAGAT CAAG 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GAGG GAAG C CTT GAGAAT G C C GAC AGC ACAGC CAT GAG GAACT G C CT GAG CAAGAT CAAG 2340 

Qy 2341 GCCATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GCCATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGAC 2400 

Qy 2401 CTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATA 2460 

I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 CTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATA 2 4 60 

Qy 24 61 GAGGAGAT GCTCAGCAAAT CCC GAGCAGGAGACACAGGAGT CAAATT GGAGGT GAAT GAA 2520 

I I I I I I I I I I I I I I I I I II I I I I I I I I I II I I I I I I I I II I I I I II I I I I I I I I I I I I I I 
Db 2461 GAG GAGAT GCT C AGCAAAT CCC GAGC AG GAGACAC AG GAGT CAAAT T GGAG GT GAAT GAA 2520 

Qy 2521 AGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCT 258 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2521 AGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCT 2580 



Qy 

Db 



2581 
2581 



AAGGACCTCCAGAGAGAGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTAAAGAGTTT 

I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I 

AAGGACCTCCAGAGAGAGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTAAAGAGTTT 



2640 
2640 



Qy 2 641 TATGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 'I I I I I I I I I I I I I I I I 

Db 2641 TATGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGG 2700 

Qy 2701 GGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAG 27 60 

II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 

Db 2701 GGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAG 2760 

Qy 27 61 GAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCC 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I 

Db 27 61 GAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCC 2820 

Qy 2821 AAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGA 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 AAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGA 2880 

Qy 2881 GTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAA 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2881 GTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAA 294 0 

Qy 2941 GAGAC AG AC AAC AT G GAC T T C T C AAG CAT GAC G C T GAC AC AGAT C AAAC G C CAAGAGAT G 3000 

I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I II I I I I I I II I I I I II I I I I I I II II 
Db 2941 GAGACAGACAACAT GGACTT CT CAAG CAT GAC G CT GACAC AGAT CAAAC G C CAAGAGAT G 3000 

Qy 3001 GAT T C T C AG GTT AGGGT GC TAGAG C T AGAAAAT GAAT T G C AGAAGGAG C GT CAAAAAC T G 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 30 01 GATTCTCAGGTTAGGGTGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTG 3060 

Qy 3061 GGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGA 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 GGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGA 3120 

Qy 3121 AC AGAG G CAT CT C CAC CTACACT G CAAGAAGT G GTAACC GAAAAAGAATAGAGC CAAAC C 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3121 AC AGAG G CAT CT C CAC CTACACT G CAAGAAGT G GT AAC C GAAAAAGAATAGAGC CAAAC C 3180 

Qy 3181 AACACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGC 3240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 AACACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGC 324 0 

Qy 3241 CACAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGA 3300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 3241 CACAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGA 3300 

Qy 3301 G GACAT GC AT GAC AC TT C CAAAGACT CC CT C CAT AGC GACAC CCTTTCTGTTTG GAC C CA 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 3301 GGACAT G CAT GAC AC TT C CAAAGAC T CC CT C CAT AGC GACAC CCTTTCTGTTTG GAC C CA 3360 

Qy 3361 TGGATTTCCACTGCTTCTTATGGTGGTTGGTTGGGTTTTTTGGTTTTGTTTTTTTTTTTT 3420 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 TGGATTTCCACTGCTTCTTATGGTGGTTGGTTGGGTTTTTTGGTTTTGTTTTTTTTTTTT 3420 

Qy 3421 AAGTTTCACTCACATAGCCAACTCTCCCAAAGGGCACACCCCTGGGGCTGAGTCTCCAGG 34 8 0 



Db 



I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

3421 AAGTTTCACTCACATAGCCAACTCTCCCAAAGGGCACACCCCTGGGGCTGAGTCTCCAGG 34 80 



Qy 3481 GCCCCCCAACTGTGGTAGCTCCAGCGATGGTGCTGCCCAGGCCTCTCGGTGCTCCATCTC 3540 

I I I I I I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 34 81 GCCCCCCAACTGTGGTAGCTCCAGCGATGGTGCTGCCCAGGCCTCTCGGTGCTCCATCTC 3540 

Qy 3541 CGCCTCCACACTGACCAAGTGCTGGCCCACCCAGTCCATGCTCCAGGGTCAGGCGGAGCT 3600 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 3541 CGCCTCCACACTGACCAAGTGCTGGCCCACCCAGTCCATGCTCCAGGGTCAGGCGGAGCT 3600 

Qy 3601 GCTGAGTGACAGCTTTCCTCAAAAAGCAGAAGGAGAGTGAGTGCCTTTCCCTCCTAAAGC 3660 

1 1 1 1 1 1 1 ii i 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 ii 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 3601 GCTGAGTGACAGCTTTCCTCAAAAAGCAGAAGGAGAGTGAGTGCCTTTCCCTCCTAAAGC 3660 

Qy 3661 TGAATCCCGGCGGAAAGCCTCTGTCCGCCTTTACAAGGGAGAAGACAACAGAAAGAGGGA 3720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 TGAATCCCGGCGGAAAGCCTCTGTCCGCCTTTACAAGGGAGAAGACAACAGAAAGAGGGA 3720 

Qy 3721 CAAGAGGGTTCACACAGCCCAGTTCCCGTGACGAGGCTCAAAAACTTGATCACATGCTTG 37 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 3721 CAAGAGGGTTCACACAGCCCAGTTCCCGTGACGAGGCTCAAAAACTTGATCACATGCTTG 3780 

Qy 37 81 AAT G GAGC T G GT GAGAT C AAC AAC AC TACT TCCCTGCCG G AAT GAACT GT C C GT GAAT G G 3840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 37 81 AAT G GAG CT G GT GAGAT CAACAACACT ACT T CCCTGCCG GAAT GAAC T GT C C GT GAAT G G 384 0 

Qy 3841 TCTCTGTCAAGCGGGCCGTCTCCCTTGGCCCAGAGACGGAGTGTGGGAGTGATTCCCAAC 3900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3841 TCTCTGTCAAGCGGGCCGTCTCCCTTGGCCCAGAGACGGAGTGTGGGAGTGATTCCCAAC 3900 

Qy 3901 TCCTTTCTGCAGACGTCTGCCTTGGCATCCTCTTGAATAGGAAGATCGTTCCACCTTCTA 3960 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 3901 TCCTTTCTGCAGACGTCTGCCTTGGCATCCTCTTGAATAGGAAGATCGTTCCACCTTCTA 3960 

Qy 3961 C G C AAT T G AC AAAC C C G GAAG AT C AG AT G CAAT T G C T C C CAT C AG G GAAG AAC C CT AT AC 4020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3961 C G CAAT T G AC AAAC C C G GAAGAT C AGAT G CAAT T G C T C C CAT C AG G G AAGAAC C C TAT AC 4020 

Qy 4021 TTGGTTTG CT AC C C T TAG TAT T TAT T AC T AAC CT C C CT T AAG C AG C AAC AG C C T AC AAAG 4 080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4021 TTGGTTTGC T AC C CT T AGT AT T TAT TACT AAC CT C C C T T AAG C AG C AAC AG C C T AC AAAG 4080 

Qy 4081 AGATGCTTGGAGCAATCAGAACTTCAGGTGTGACTCTAGCAAAGCTCATCTTTCTGCCCG 414 0 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 4081 AGATGCTTGGAGCAATCAGAACTTCAGGTGTGACTCTAGCAAAGCTCATCTTTCTGCCCG 414 0 

Qy 4141 GCTACATCAGCCTTCAAGAATCAGAAGAAAGGCCAAGGTGCTGGACTGTTACTGACTTGG 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCTACATCAGCCTTCAAGAATCAGAAGAAAGGCCAAGGTGCTGGACTGTTACTGACTTGG 4200 

Qy 4201 AT CCCAAAGCAAGGAGAT CATTTGGAGCTCTT GGGT CAGAGAAAAT G AG AAAG G AC AG AG 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4201 AT C C C AAAG C AAG GAGAT CAT T T G GAG CTCTTGGGT CAGAGAAAAT GAGAAAG GAC AG AG 4260 

Qy 4261 CCAGCGGCTCCAACTCCTTTCAGCCACATGCCCCAGGCTCTCGCTGCCCTGTGGACAGGA 4320 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 



Db 



4261 CCAGCGGCTCCAACTCCTTTCAGCCACATGCCCCAGGCTCTCGCTGCCCTGTGGACAGGA 4 320 



Qy 



Db 



4321 T GAG GACAGAGGG CACAT GAACAGCT T G C CAG GGAT GG GCAG C C CAAC AG C ACTT TT CCT 4380 

I I I I 1 I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4321 T GAGGACAGAG GG CACAT GAACAGCT T G C CAGGGAT GG GC AGC C CAACAG C ACTT TT CCT 4 380 



Db 



4381 CTTCTAGATGGACCCCAGCATTTAAGTGACCTTCTGATCTTGGGAAAACAGCGTCTTCCT 4 44 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I 

4381 CTTCTAGATGGACCCCAGCATTTAAGTGACCTTCTGATCTTGGGAAAACAGCGTCTTCCT 44 4 0 



Qy 



4441 TCTTTATCTATAGCAACTCATTGGTGGTAGCCATCAAGCACTTCGGAATTCCTGCAGCCC 4500 




Db 



4 4 41 TCTTTATCTATAGCAACTCATTGGTGGTAGCCATCAAGCACTTCGGAATTCCTGCAGCCC 4500 



Qy 



4 501 GGGCGGCCGCTCGAGCATGCNNTAGAGGGCCCTA 4534 




Db 



4501 GGGCGGCCGCTCGAGCATGCNNTAGAGGGCCCTA 4 534 



RESULT 2 
AEB71165 

ID AEB71165 standard; DNA; 4534 BP. 
XX 

AC AEB71165; 
XX 

DT 20-OCT-2005 (first entry) 
XX 

DE DNA encoding full length HIP1, SEQ ID NO:l. 

XX 

KW Cancer; cytosatic; diagnosis; genetic marker; HIP1; immunodiagnosis ; 
KW drug screening; western blot; ELISA; ds ; gene. 

XX 

OS Homo sapiens. 
XX 

FH Key Location/Qualifiers 

FT CDS 58. .3171 

FT /*tag= a 

FT /product= "HI PI" 

XX 

PN WO2005072457-A2. 
XX 

PD ll-AUG-2005. 
XX 

PF 28-JAN-2005; 2 005WO-US003330 . 
XX 

PR 29-JAN-2004; 2004US-00767325 . 
XX 

PA (UNMI ) UNIV MICHIGAN. 
XX 

PI Ross TS, Mizukami IF; 
XX 

DR WPI; 2005-582467/59. 
DR P-PSDB; AEB71166. 
XX 

PT Detecting cancer (especially prostate or colon cancer) comprises 

PT providing a sample from a subject suspected of having cancer, and 

PT detecting the presence or absence of antibodies to HIP1 in the sample. 



PS Disclosure; SEQ ID NO 1; 118pp; English. 

XX 

CC The present invention relates to compositions and methods for cancer 

CC diagnosis, including HIP1 cancer markers. HIP1 is a cofactor in clathrin 

CC mediated trafficking. HIP1 over-expression may dysregulate growth factor 

CC receptor cell surface density or growth factor secretion, as a 

CC consequence of its role in clathrin-mediated trafficking. Specifically 

CC claimed is a method of detecting cancer by providing a sample from a 

CC subject suspected of having cancer, and detecting the presence or absence 

CC of antibodies to HIP1 in the sample. Also disclosed are methods of 

CC screening for anticancer drugs; drugs identified by the above method; and 

CC methods of treating cancer. The cancer is selected from prostate cancer 

CC and colon cancer. The detecting step comprises exposing the sample to a 

CC HIP1 antigen. It comprises a Western blot or an ELISA assay. The reagent 

CC comprises a HIP1 antigen, and a second antibody that binds to the 

CC antibodies to HIP1. The present sequence is DNA encoding full length 

CC HIP1. 

XX 

SQ Sequence 4534 BP; 1176 A; 1230 C; 1232 G; 894 T; 0 U; 2 Other; 

Query Match 100.0%; Score 4534; DB 14; Length 4534; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4 534; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCAAGCTTGGTACCCCCGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATG 60 

I I I I I I I I I I I I I I II II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I! I 
Db 1 CCAAGCTTGGTACCCCCGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATG 60 

Qy 61 GATCGGATGGCCAGCTCCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGG 120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 GATCGGATGGCCAGCTCCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGG 120 

Qy 121 CGCGGGGTCGGCGCTGGGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACT 180 

I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I ! I I I I I I I I I I I I I I I I 
Db 121 CGCGGGGTCGGCGCTGGGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACT 180 

Qy 181 GT CAGCAT CAATAAGG C CAT T AAT AC GC AG GAAGT GGCT GTAAAGGAAAAAC AC GC CAGA 240 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 GT CAG CAT C AAT AAG G C CAT T AAT AC GC AG GAAG T G G C T G T AAAG GAAAAAC AC G C CAGA 24 0 

Qy 241 ACGTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAAC 300 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 ACGTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAAC 300 

Qy 301 CGCCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGT^AGTTCTGCCATGTGTTCCACAAA 360 

I II I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 301 CGCCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAA 3 60 

Qy 361 CT CCT C CGAGAT GG ACAC C C GAAC GT C CT GAAGGACT C T CT GAGAT ACAGAAAT GAATT G 42 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 361 CT C CT C C GAGAT GGACAC C C GAAC GT C CT GAAGGACT CT CT GAGAT ACAGAAAT GAATT G 42 0 



Qy 

Db 



421 
421 



480 
480 



Qy 

Db 



481 TACCTGAAACTGCTAAGAACCAAGATGGAGTACCACACCAAAAATCCCAGGTTCCCAGGC 54 0 

I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 81 TACCTGAAACTGCTAAGAACCAAGATGGAGTACCACACCAAAAATCCCAGGTTCCCAGGC 54 0 



Qy 541 AACCTGCAGATGAGTGACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTT 600 

. I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 AAC CT GCAGAT GAGTGAC C GC CAGCT GGAC GAG GCT GGAGAAAGT GAC GT GAACAACTT T 600 

Qy 601 TCCCAGTTAACAGTGGAGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 
Db 601 TCCCAGTTAACAGTGGAGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACA 660 

Qy 661 GTATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGC 720 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 661 GTATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGC 720 

Qy 721 CTCGCCCCGCT GAT CCAGGT CAT CT T GGAC T G CAG C C AC CTTT AT GACT ACACT GT CAAG 7 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CTCGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAG 7 80 

Qy 781 CTTCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGC 840 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 781 CTTCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGC 840 

Qy 841 TTCATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I I I I 
Db 841 TTCATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTAC 900 

Qy 901 TTCAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 TTCAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCC 960 

Qy 961 TCAGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCC 1020 

I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCAGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCC 1020 

Qy 1021 GACAG C GAG C CAGT C CT AGAGAAG GAT GAC CT CAT G GACAT GGAT GC CT CT C AG CAGAAT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 GACAG C GAGC CAGT C CT AGAGAAG GAT GAC C T CAT G GACAT G GAT GC CT C T CAG CAGAAT 108 0 

Qy 1081 TTATTTGACAACAAGTTTGATGACATCTTTGGCAGTTCATTCAGCAGTGATCCCTTCAAT 114 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 TTAT TT GACAACAAGT T T GAT GACAT CTTT GGC AGT T CAT T CAG CAGT GAT C C CTT CAAT 1140 

Qy 1141 TT CAACAGT CAAAAT GGT GT GAACAAGGAT GAGAAG GACC ACT TAATT GAGC GAC TAT AC 12 00 

I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I 
Db 1141 TT CAACAGT CAAAAT GGT GTGAACAAGGAT GAGAAGGACCACTTAATT GAGCGACTATAC 12 00 

Qy 1201 AGAGAGAT CAGT GGAT T GAAG GCACAG C T AGAAAACAT GAAGACT GAGAG C CAG C G G GT T 12 60 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGAGAGAT C AG T G GAT T GAAG G C AC AG C T AGAAAACAT GAAGACT GAGAG C CAG C G G GT T 12 60 

Qy 12 61 GT GCT GCAG CT GAAG GGC CAC GT CAG C GAG C T G GAAG CAGAT CT G GC C GAGCAG CAG CAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GTGCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCAC 1320 

Qy 1321 CT G C G G CAG C AG GC G G C CGAC GACT GT GAAT T C CT GC G GGCAGAACT G GAC GAGC T C AGG 1380 



Db 



I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 CTGCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGG 1380 



Qy 1381 AGGCAGCGGGAGGACACCGAGAAGGCTCAGCGGAGCCTGTCTGAGATAGAAAGGAAAGCT 1440 

I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 AGG C AG C G G GAG GACACC GAGAAG G CT CAG C G GAG CCTGT CT GAGATAGAAAGGAAAGCT 1440 

Qy 1441 CAAGC CAAT GAACAG C GAT ATAGCAAGCTAAAG GAGAAGTACAG CGAG CT G GT T CAGAAC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 14 41 CAAGC CAAT GAACAGC GAT AT AG C AAGCTAAAG GAGAAGTACAG C GAG CT G GT T CAGAAC 1500 

Qy 1501 CACGCTGACCTGCTGCGGAAGAATGCAGAGGTGACCAAACAGGTGTCCATGGCCAGACAA 1560 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 1501 C AC G CT GAC CT G CT GC GGAAGAAT GCAGAG GT GAC CAAAC AGGT GT C CAT GGC CAGACAA 1560 

Qy 1561 G CC CAGGTAGAT TT GGAAC GAGAGAAAAAAGAGCT GGAG GATT C GT T GGAGC G CAT CAGT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I 
Db 1561 G CC CAG GTAGAT T T G GAAC GAGAGAAAAAAGAGCT GGAG GAT T C GT T GGAG C GCAT CAGT 1620 

Qy 1621 GAC CAG GG C CAG C GGAAGACT CAAGAACAGCT GGAAGTT CT AGAGAGC T T GAAGC AGGAA 1680 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1621 GAC CAG GG C CAG C G GAAGACT CAAGAACAGCT G GAAGTT CT AGAGAG CT T GAAGCAGGAA 1680 

Qy 1681 CTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAG 1740 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1681 CTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAG 1740 

Qy 1741 T CAGAAG CAAACT G G G CAG CC GAGT T C G C C GAG CT AGAGAAG GAGC GG GACAG C C T G GT G 1800 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1741 TCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTG 1800 

Qy 1801 AGTGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACT 18 60 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1801 AGTGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACT 18 60 

Qy 18 61 CAG CT CAAACT G GC CAGCACAGAG GAAT CTAT GT G C CAG C T T GC CAAAGAC CAAC GAAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 18 61 CAG CT CAAAC T G G C CAG CACAGAG GAAT CTAT GT G CC AG CT T GC CAAAGAC CAAC GAAAA 1920 

Qy 1921 ATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 1921 ATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACCAG 1980 

Qy 1981 CTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTC 204 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 CTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTC 204 0 

Qy 2041 ACATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 ACAT C C AT TT C C AGCT G CAT C GAG CAACT G GAGAAAAG C T GGAG C C AGT AT CT G G C CT G C 2100 

Qy 2101 CCAGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 C C AGAAGACAT CAGT GGACTT CT C CATT C CATAAC CCTGCTGGCC C ACT T GAC CAG C GAC 2160 

Qy 2161 GCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTG 2220 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2161 GCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTG 2220 

Qy 2221 ACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 1 I I I I 

Db 2221 ACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAA 2280 

Qy 2281 GAGGGAAGCCTTGAGAATGCCGACAGCACAGCCATGAGGAACTGCCTGAGCAAGATCAAG 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2281 GAG G GAAGC CTT GAGAAT GC C GACAGCACAGC CAT GAG GAACT G C CT GAG CAAGAT CAAG 234 0 

Qy 2341 GCCATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 GCCATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGAC 24 00 

Qy 2 4 01 CTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATA 2460 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 CTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATA 24 60 

Qy 24 61 GAG GAGAT GCT C AG CAAAT C C C GAG CAG GAGACACAGGAGT CAAAT T G GAGGT GAAT GAA 2520 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 GAGGAGAT GCT CAG CAAAT CC C GAGCAG GAGACACAGGAGT CAAAT T G GAGGT GAAT GAA 2520 

Qy 2521 AGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCT 2580 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 AGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCT 258 0 

Qy 2 581 AAG GAC CT CCAGAGAGAGATT GT G GAGAGC G GCAG GGGT ACAGCAT C C C CTAAAGAGTT T 264 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AAG GAC C T C CAGAGAGAGAT T GT G GAGAGC G G CAG GG GT ACAG CAT C C C CTAAAGAGTT T 2 640 

Qy 2 641 TAT G C CAAGAACT CT C GAT G GACAGAAGGAC T TAT CT CAG C CT C CAAG GCTGTGGGCTGG 2700 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 641 TATGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGG 2700 

Qy 2701 GGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAG 27 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2701 GGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAG 27 60 

Qy 27 61 GAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCC 2820 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I I I I I I I I I I 
Db 2761 GAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCC 2 820 

Qy 2821 AAGGT GAAAG CT GATAAGGACAGC CC CAAC CT AGC C C AG CT G CAG CAG GCCTCTCGGG GA 28 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2 821 AAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGA 28 8 0 

Qy 2881 GTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAA 294 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAA 2 94 0 

Qy 2 941 GAG AC AGAC AAC AT GGACT T C T CAAG CAT GAC GCT GAC ACAGAT C AAAC G C CAAGAGAT G 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 GAG AC AGACAAC AT GGACT T C T CAAG CAT GAC GCT GACACAGAT CAAAC GC CAAGAGAT G 3000 

Qy 3001 GAT T CT CAGGTT AG G GT GCT AGAG CT AGAAAAT GAAT T G CAGAAG GAG C GT CAAAAACT G 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 GATTCTCAGGTTAGGGTGCTAGAGCTAGAAAAT GAAT TG CAGAAG GAG CGT CAAAAACT G 3060 



Qy 3061 GGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGA 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 GGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGA 3120 

Qy 3121 ACAGAGG CAT CTC CAC CTAC ACT G CAAGAAGT GGT AAC C GAAAAAGAATAGAG C CAAAC C 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 3121 ACAGAGGCAT CT C CAC CTACACT GCAAGAAGT GGT AAC C GAAAAAGAATAGAG C CAAAC C 3180 

Qy 3181 AACACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGC 32 40 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 AACACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGC 32 40 

Qy 3241 CACAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGA 3300 

I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 3241 C ACAG GC CAAAT C CT T GGAGT C C CAG G GGCAGCCAC AC CACT GC CATTAC C C AGT GC CGA 3300 

Qy 3301 GGACATGCATGACACTTCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACCCA 33 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 3301 GGACATGCATGACACTTCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACCCA 33 60 

Qy 3361 TGGATTTCCACTGCTTCTTATGGTGGTTGGTTGGGTTTTTTGGTTTTGTTTTTTTTTTTT 3420 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3361 TGGATTTCCACTGCTTCTTATGGTGGTTGGTTGGGTTTTTTGGTTTTGTTTTTTTTTTTT 3420 

Qy 3421 AAGTTTCACTCACATAGCCAACTCTCCCAAAGGGCACACCCCTGGGGCTGAGTCTCCAGG 348 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I II I 
Db 3421 AAGTTTCACTCACATAGCCAACTCTCCCAAAGGGCACACCCCTGGGGCTGAGTCTCCAGG 34 80 

Qy 3481 GCCCCCCAACTGTGGTAGCTCCAGCGATGGTGCTGCCCAGGCCTCTCGGTGCTCCATCTC 354 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 34 81 GCCCCCCAACTGTGGTAGCTCCAGCGATGGTGCTGCCCAGGCCTCTCGGTGCTCCATCTC 354 0 

Qy 3541 CGCCTCCACACTGACCAAGTGCTGGCCCACCCAGTCCATGCTCCAGGGTCAGGCGGAGCT 3600 

I I II I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 3541 CGCCTCCACACTGACCAAGTGCTGGCCCACCCAGTCCATGCTCCAGGGTCAGGCGGAGCT 3600 

Qy 3601 G CT GAGT GACAG CTTT C CT CAAAAAG CAGAAG GAGAGT GAGT GCCTTTCCCTC CTAAAG C 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3601 GCTGAGTGACAGCTTTCCTCAAAAAGCAGAAGGAGAGTGAGTGCCTTTCCCTCCTAAAGC 3660 

Qy 3661 TGAATCCCGGCGGAAAGCCTCTGTCCGCCTTTACAAGGGAGAAGACAACAGAAAGAGGGA 372 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 T GAAT C C C G G C G GAAAG CCTCTGTCCGCCTT T ACAAG G GAGAAG AC AAC AG AAAG AG G GA 3720 

Qy 3721 CAAGAGG GT T CACACAGC C C AGT T C C C GT GAC GAG G CT CAAAAAC T T GAT CAC AT GCTT G 37 80 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3721 CAAGAGGGTTCACACAGCCCAGTTCCCGTGACGAGGCTCAAAAACTTGATCACATGCTTG 3780 

Qy 37 81 AAT GGAG CT G GT GAGAT CAACAACACT ACT TCCCTGCCG GAAT GAAC T GT C CGT GAAT GG 384 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 37 81 AAT GGAG CT G GT GAGAT CAAC AACACTACT TCCCTGCC GGAAT GAACT GT C C GT GAAT G G 3840 

Qy 38 41 TCTCTGTCAAGCGGGCCGTCTCCCTTGGCCCAGAGACGGAGTGTGGGAGTGATTCCCAAC 3900 

I I I II I I I I I I I I I I I I II I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 38 41 TCTCTGTCAAGCGGGCCGTCTCCCTTGGCCCAGAGACGGAGTGTGGGAGTGATTCCCAAC 3900 



Qy 

Db 



3901 TCCTTTCTGCAGACGTCTGCCTTGGCATCCTCTTGAATAGGAAGATCGTTCCACCTTCTA 3960 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I 

3901 TCCTTTCTGCAGACGTCTGCCTTGGCATCCTCTTGAATAGGAAGATCGTTCCACCTTCTA 3960 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 



3961 C GCAATT GACAAAC C C GGAAGAT CAGAT GCAAT T GCT C CCAT CAG GGAAGAAC C CTATAC 4020 

I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3961 C GCAATT GACAAAC C C G GAAGAT CAGAT GCAAT TGCT C C CAT C AGGGAAGAAC C CTATAC 4020 

4021 TTGGTTTGCTACCCTTAGTATTTATTACTAACCTCCCTTAAGCAGCAACAGCCTACAAAG 4 080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
4 021 TTGGTTTGCTACCCTTAGTATTTATTACTAACCTCCCTTAAGCAGCAACAGCCTACAAAG 4080 

4 081 AGATGCTTGGAGCAATCAGAACTTCAGGTGTGACTCTAGCAAAGCTCATCTTTCTGCCCG 4140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 081 AGATGCTTGGAGCAATCAGAACTTCAGGTGTGACTCTAGCAAAGCTCATCTTTCTGCCCG 4140 

4141 GCTACATCAGCCTTCAAGAATCAGAAGAAAGGCCAAGGTGCTGGACTGTTACTGACTTGG 4200 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
4141 GCTACATCAGCCTTCAAGAATCAGAAGAAAGGCCAAGGTGCTGGACTGTTACTGACTTGG 4200 

4201 AT C C CAAAGCAAG GAGAT CATT T G GAG CT CTT G GGT CAGAGAAAAT GAGAAAG GACAGAG 4260 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4201 AT C C CAAAG CAAGGAGAT CATTT GGAG CT CTT G GGT CAGAGAAAAT GAGAAAG GACAGAG 4260 

4261 CCAGCGGCTCCAACTCCTTTCAGCCACATGCCCCAGGCTCTCGCTGCCCTGTGGACAGGA 4320 

I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
42 61 CCAGCGGCTCCi^ACTCCTTTCAGCCACATGCCCCAGGCTCTCGCTGCCCTGTGGACAGGA 4320 

4 321 TGAGGACAGAGGGCACATGAACAGCTTGCCAGGGATGGGCAGCCCAACAGCACTTTTCCT 4380 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4 321 TGAGGACAGAGGGCACATGAACAGCTTGCCAGGGATGGGCAGCCCAACAGCACTTTTCCT 4380 

4381 CTTCTAGATGGACCCCAGCATTTAAGTGACCTTCTGATCTTGGGAAAACAGCGTCTTCCT 444 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I II I I I I I I I I 
4 381 CTTCTAGATGGACCCCAGCATTTAAGTGACCTTCTGATCTTGGGAAAACAGCGTCTTCCT 4 4 4 0 

4 441 TCTTTATCTATAGCAACTCATTGGTGGTAGCCATCAAGCACTTCGGAATTCCTGCAGCCC 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

4 441 TCTTTATCTATAGCAACTCATTGGTGGTAGCCATCAAGCACTTCGGAATTCCTGCAGCCC 4500 

4501 GGGCGGCCGCTCGAGCATGCNNTAGAGGGCCCTA 4 534 

II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4501 GGGCGGCCGCTCGAGCATGCNNTAGAGGGCCCTA 4534 
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RESULT 1 

US-09-949-016-4586 

; Sequence 4586, Application US/09949016 
; Patent No. 6812339 
; GENERAL INFORMATION: 

; APPLICANT: VENTER, J. Craig et al . 

; TITLE OF INVENTION: POLYMORPHISMS IN KNOWN GENES ASSOCIATED 

; TITLE OF INVENTION: WITH HUMAN DISEASE, METHODS OF DETECTION AND USES 

THEREOF 

FILE REFERENCE: CL001307 
; CURRENT APPLICATION NUMBER: US/09/949, 016 
; CURRENT FILING DATE: 2000-04-14 
; PRIOR APPLICATION NUMBER: 60/241,755 
; PRIOR FILING DATE: 2000-10-20 

PRIOR APPLICATION NUMBER: 60/237,768 

PRIOR FILING DATE: 2000-10-03 
; PRIOR APPLICATION NUMBER: 60/231,498 

PRIOR FILING DATE: 2000-09-08 
; NUMBER OF SEQ ID NOS : 207012 

SOFTWARE: FastSEQ for Windows Version 4.0 
; SEQ ID NO 4586 
; LENGTH: 6628 
TYPE: DNA 
ORGANISM: Human 
US-09-949-016-4586 



Query Match 61.3%; Score 2779; DB 3; Length 6628; 

Best Local Similarity 99.8%; Pred. No. 0; 



Matches 3179; Conservative 0; Mismatches 2; Indels 4; Gaps 



1; 



Qy 183 CAGCAT CAATAAGG C CATTAATAC G CAG GAAGT G G CT GTAAAGGAAAAACAC GC CAGAAC 242 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CAGCAT CAATAAGGC CATTAATAC G CAG GAAGT GG CT GTAAAGGAAAAACAC GC CAGAAC 60 

Qy 243 GTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCG 302 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 GTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCG 120 

Qy 303 CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 362 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACT 180 

Qy 363 C CT C CGAGAT GGACAC C CGAAC GT C C T GAAGGACT C T CT GAGATACAGAAAT GAATT GAG 422 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 181 C CT C CGAGAT GGACAC C CGAAC GT C CT GAAGGACT CT CT GAGATACAGAAAT GAAT T GAG 24 0 

Qy 423 T GACAT GAG CAG GAT GT GG GGCTAC CT GAG C GAG G GGT AT G GC CAG CT GT G CAG CAT CT A 482 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 241 TGACATGAGCAGGATGTGGGGCCACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTA 300 

Qy 4 83 CC T GAAACT G CTAAGAAC CAAGAT G GAGTACCACAC CAAAAAT C C CAG GT T C C CAG GC AA 542 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 301 C CTGAAACT GCTAAGAAC CAAGAT G GAG T AC CACAC CAAAAAT C C C AG GT T C C CAG GCAA 360 

Qy 54 3 CCTGCAGATGAGTGACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTTTC 602 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 361 CCTGCAGATGAGTGACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTTTT 420 

Qy 603 CCAGTTAACAGTGGAGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACAGT 662 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 421 C CAGTTAAC AGT G GAGAT GT T T GACT AC CT GGAGT GT GAACT CAAC CT CTT C CAAAC AGT 4 80 

Qy 663 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 722 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 ATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCT 540 

Qy 723 CGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCT 782 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 CGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCT 600 

Qy 783 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 842 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II II I I I I I I I I I I I I I I 
Db 601 TCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTT 660 

Qy 843 CAT G GAGCAGT T TACAAAGT TGAAAGATCTGTTCTACCGCTC CAG CAAC CTGCAGT ACT T 902 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 CATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTACTT 720 

Qy 903 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 962 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 CAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTC 780 

Qy 963 AGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGA 1022 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 781 AGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGA 84 0 



Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1023 CAGCGAG CCAGT C CT AGAGAAGGAT GAC CT CAT G GACAT GGAT G C CT CT CAG CAGAATT T 1082 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I I 
841 CAG C GAG CCAGT C CTAGAGAAG GAT GAC CT CAT G GAC AT GGAT G C CT CT CAG CAGAATT T 900 

1083 ATT TGACAACAAGT T T GAT GACAT CTTT GGCAGT T CAT T C AGCAGT GAT C C CTT CAATT T 1142 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
901 AT T T GACAACAAGTTT GAT GACAT CT T T GG CAGT TCATT CAG CAGT GAT C C CT T CAATTT 960 

1143 CAACAGTCAAAAT GGT GT GAACAAGGAT GAGAAGGACCACTTAATTGAGCGACTATACAG 1202 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
961 CAACAGT CAAAAT G GT GT GAACAAGGAT GAGAAG GAC CACT TAATT GAGC GACTAT ACAG 1020 

1203 AGAGAT CAGT GGAT T GAAG G C ACAG CTAGAAAAC AT GAAGACT GAGAG C CAG C GG GT T GT 12 62 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1021 AGAGAT CAGTG G AT T GAAG G CACAG CTAGAAAAC AT GAAGACT GAGAGC CAGC GG GTT GT 1080 

12 63 GCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCACCT 1322 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1081 G CT GCAG CT GAAGG G C C AC GT CAG C GAG CT GGAAGCAGAT CT GG C C GAGCAG CAG CACCT 114 0 

1323 GCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAG 1382 

I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
1141 G C G GCAG CAGG C GGC C GAC GACT GT GAATT C CT G CG G GCAGAACT G GAC GAG CT CAG GAG 12 00 

13 8 3 G CAG C G G GAG GAC AC C GAGAAG G C T CAG C G GAG C C T GT C T GAGAT AGAAAG GAAAG C T C A 14 42 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1201 G CAG C GG GAG GAC AC C GAGAAG G C T CAG C G GAG C C T GT C T GAGAT AGAAAG GAAAG C T C A 12 60 

14 43 AGC CAAT GAAC AG C GAT AT AG CAAG CT AAAGGAGAAGTAC AG C GAG CT G GT T CAGAAC CA 1502 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
12 61 AGC CAAT GAACAG C GAT AT AG CAAGC TAAAGGAGAAGT ACAG C GAG CT G GTT CAGAAC CA 1320 

1503 C GCT GAC CT GCT GC G GAAGAAT G CAGAGGT GAC CAAAC AGGT GT C CAT GGC C AGAC AAG C 1562 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1321 CGCTGACCTGCTGCGGAAGAATGCAGAGGTGACCAAACAGGTGTCCATGGCCAGACAAGC 1380 

1563 C CAG G TAG AT T T G GAAC G AG AGAAAAAAGAG C T G GAG GAT T C G T T G GAG C G CAT CAGT G A 1622 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1381 CCAGGTAGATTTGGAACGAGAGAAAAAAGAGCTGGAGGATTCGTTGGAGCGCATCAGTGA 14 40 

1623 C CAGG GC CAGC G GAAGACT CAAGAACAGCT GGAAGT T CT AGAGAG CT T GAAGCAG GAACT 1682 

I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
14 41 CCAGGGC CAGC GGAAGACT CAAGAACAGCT GGAAGTTCTAGAGAGCTTGAAGCAGGAACT 1500 

1683 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1742 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1501 TGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTC 1560 

174 3 AGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTGAG 1802 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTGAG 1620 

1803 T GG C G CAG CT CAT AG GGAGGAG GAAT TAT C T GCT CT T C G GAAAGAACT G C AGGACAC T C A 1862 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1621 T GG CG CAG CT CAT AG G GAG GAG GAAT T AT CT G CT CT T C G GAAAGAACT GCAGGACACT C A 1680 



Qy 

Db 



1863 GCTCAAACTGGCCAGCACAGAG GAAT CT AT GT G C C AG CTT G C CAAAGAC C AAC G AA 1918 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 GCTCAAACTGGCCAGCACAGAGGCAAGAATCTATGTGCCAGCTTGCCAAAGACCAACGAA 1740 



Qy 1919 AAATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACC 1978 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 
Db 1741 AAATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCCTGAACC 1800 

Qy 197 9 AGCTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGG 2038 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 
Db 1801 AGCTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGG 18 60 

Qy 2039 T CAC AT C CAT T T C CAGCT G CAT C GAG CAACT GGAGAAAAGCT G GAG C CAGTAT CT GGC CT 2098 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1861 TCACATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCT 1920 

Qy 2099 GCCCAGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCG 2158 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I II I I I I I 
Db 1921 GCCCAGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCG 1980 

Qy 2159 ACGCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCAC 2218 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1981 ACGCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCAC 2040 

Qy 2219 TGACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGG 2278 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2041 TGACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGG 2100 

Qy 227 9 AAGAGG GAAGC CT T GAGAAT GC C GACAGCACAGC CAT GAGGAACT G C C T GAG CAAGAT CA 2338 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 AAGAG G GAAG C CT T GAGAAT GC C GACAGCACAGC CAT GAGGAACT GC CT GAGCAAGAT CA 2160 

Qy 2339 AGGCCATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGG 2398 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 AGGCCATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGG 2220 

Qy 2399 ACCTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAA 2458 

I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I 
Db 2221 ACCTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAA 2280 

Qy 2459 T AGAG GAGAT G CT C AGC AAAT C C C GAG CAG GAGAC AC AG GAGT C AAAT T G G AG GT GAAT G 2518 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I 
Db 2281 T AGAG GAGAT G CT CAG CAAAT C C C GAGCAG GAGACACAGGAGT CAAAT T G GAG GT GAAT G 2340 

Qy 2519 AAAGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCT 2578 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 AAAGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCT 24 00 

Qy 2579 CT AAG GAC CT C CAGAGAGAGAT T GT GGAGAG C G G CAG GG GTACAG CAT C C C CT AAAGAGT 2638 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 2401 CTAAG GAC C T C CAGAGAGAGAT T GT GGAGAG C GG CAG GG GTACAG CAT C C CCTAAAGAGT 24 60 

Qy 2639 TTTATGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCT 2698 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 61 TT T AT G C CAAGAACT CT C GAT G GACAGAAG GAC T TAT CT CAG C CT C CAAG GCT GT G GG CT 252 0 

Qy 2699 GGGGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTG 2758 



Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I I 1 1 1 1 1 1 1 

2521 GGGGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTG 2580 

2759 AGGAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCAT 2818 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2581 AGGAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCAT 264 0 

2819 CCAAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGG 2878 

I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2 641 CCAAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGG 2700 

2 879 GAGTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCG 2938 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2701 GAGTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCG 2760 

2939 AAGAGACAGACAACAT GGACTTCT CAAGCAT GACGCT GACACAGATCAAAC GCCAAGAGA 2998 

I II I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2761 AAGAGACAGACAACAT GGACTTCT CAAGCAT GACGCT GACACAGAT CAAAC GCCAAGAGA 2820 

2999 T GGATT CT CAGGTTAGGGTGCTAGAGCTAGAAAAT GAATT GCAGAAGGAGC GT CAAAAAC 3058 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2821 T GGATT CT CAGGTTAGGGTGCTAGAGCTAGAAAAT GAATT GCAGAAGGAGC GT CAAAAAC 28 80 

3059 TGGGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAG 3118 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2881 TGGGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAG 2 94 0 

3119 GAACAGAG G CAT C T C CAC CT AC ACT G CAAGAAGT G GTAAC C GAAAAAGAAT AGAGCCAAA 3178 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I II I I I I I I I I I 
2941 GAACAGAG G CAT C T C CAC CT ACACT G CAAGAAGT G GTAAC C GAAAAAGAAT AGAG C C AAA 3000 

317 9 CCAACACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCA 3238 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I 
3001 C CAACAC C C CAT AT GT CAGT GT AAAT CC TT GT T AC CTAT CT C GT GT GT GTTAT T T C C C CA 3060 

3239 GCCACAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCC 329 8 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 
3061 GCCACAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCC 3120 

3299 GAGGACATGCATGACACTTCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACC 3358 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3121 GAGGACATGCATGACACTTCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACC 318 0 

3359 CATGG 3363 

I I I I I 
3181 CATGG 3185 

GenCore version 5.1.6 
Copyright (c) 1993 - 2006 Compugen Ltd. 
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US-10-007-047-1 



Perfect score: 4534 

Sequence: 1 ccaagcttggtacccccggg gcatgcnntagagggcccta 4534 



Scoring table: OLIGO_NUC 

Gapop 60.0 , Gapext 60.0 

Searched: 9793542 seqs, 4134689005 residues 

Word size : 0 

Total number of hits satisfying chosen parameters: 19587084 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 

Post-processing: Listing first 45 summaries 

Database : Published__Applications_NA_Main: * 

1 : /cgn2_6/ptodata/l/pubpna/US07_PUBCOMB.seq: * 

2 : /cgn2_6/ptodata/ l/pubpna/US08_PUBCOMB . seq : * 

3: /cgn2_6/ptodata/l/pubpna/US09A_PUBCOMB. seq: * 
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Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
US-10-007-047-1 

; Sequence 1, Application US/10007047 

; Publication No. US20030124533A1 

; GENERAL INFORMATION : 

; APPLICANT: Mizukami, Ikuko 

/ APPLICANT: Ross, Theodora 

; APPLICANT: Rao, Dinesh 

; TITLE OF INVENTION: HIP1 Cancer Markers 
; FILE REFERENCE: UM-06692 

; CURRENT APPLICATION NUMBER: US/ 10/ 007 , 047 
; CURRENT FILING DATE: 2001-12-06 
; NUMBER OF SEQ ID NOS : 6 

SOFTWARE: Patentln version 3.0 
; SEQ ID NO 1 

LENGTH: 4534 

TYPE: DNA 
; ORGANISM: Homo sapiens 

FEATURE: 

NAME/ KEY : mis c_f eature 

LOCATION: ( 4521 )..( 4521 ) 
; OTHER INFORMATION: The nucleotide "n" can be either a,t,c, or g 
; NAME/KEY: misc_f eature 

LOCATION: ( 4522 )..( 4522 ) 
; OTHER INFORMATION: The nucleotide "n ,f can be either a,t,c, or g 
US-10-007-047-1 



Query Match 100.0%; Score 4534; DB 6; Length 4534; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 4534; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1 CCAAGCTTGGTACCCCCGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATG 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1 CCAAGCTTGGTACCCCCGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATG 60 

Qy 61 GATCGGATGGCCAGCTCCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGG 120 

I I I I I I II I I I I I I I II I I I I I I I I I I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I I 

Db 61 GATCGGATGGCCAGCTCCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGG 120 

Qy 121 CGCGGGGTCGGCGCTGGGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACT 180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 CGCGGGGTCGGCGCTGGGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACT 180 

Qy 181 GT CAGCAT CAATAAGGCCATTAATACGCAGGAAGT GGCT GTAAAGGAAAAACAC GCCAGA 24 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
Db 181 GT CAGCAT CAATAAG GC CATTAAT AC GCAG GAAGT GGCT GTAAAG GAAAAACAC GC C AGA 240 

Qy 241 ACGTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAAC 300 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 241 ACGTGCATACTGGGCACCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAAC 300 

Qy 301 CGCCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAA 360 

II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 301 CGCCTGCCTCTGTCTAGCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAA 360 

Qy 361 CT C CT C CGAGAT GGACAC C C GAAC GT CC T GAAG GAC T CT CT GAGAT AC AGAAAT GAATT G 42 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3 61 CT C C T C C GAGAT G GACAC C C GAAC GT CCT GAAG GACT CT CT GAGAT ACAGAAAT GAAT T G 420 

Qy 421 AGT GACAT GAG C AGGAT GT GG GG CT AC CT GAG C GAG GGGTAT G G C CAGCT GT GCAGCAT C 480 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
Db 421 AGTGACATGAGCAGGATGTGGGGCTACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATC 4 80 

Qy 4 81 T AC C T GAAAC T G C T AAG AAC C AAGAT G G AGT AC C AC AC C AAAAAT C C C AG GT T C C C AG G C 540 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 81 T AC C T GAAAC T GC T AAGAAC C AAGAT G GAGTAC C AC AC C AAAAAT C C CAG GT T C C C AG G C 540 

Qy 541 AAC C T G CAGAT GAGT GAC C G C CAG CT GGAC GAGG C T GGAGAAAGT GAC GT GAACAAC T T T 600 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
Db 541 AAC CT G CAGAT GAGT GAC C G C CAG CT GGAC GAG G CT G GAGAAAGT GAC GT GAACAACT T T 600 

Qy 601 T C CCAGTTAAC AGT G GAGAT GT T T GACTAC CT G GAGT GT GAACT CAAC C T CT T C CAAACA 660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 T C C C AGT T AAC AGT G GAGAT GT T T GAC T AC CT G GAGT GT GAAC T CAAC C T CTT C CAAACA 660 

Qy 661 GTATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGC 720 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I II I I 
Db 661 GTATTCAACTCCCTGGACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGC 720 



Qy 

Db 



721 CTCGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAG 78 0 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I II I I I I I 
721 CTCGCCCCGCTGATCCAGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAG 7 80 



Qy 

Db 



781 CTTCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGC 840 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I 1 I I I I I 

7 81 CTTCTCTTCAAACTCCACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGC 84 0 



Qy 841 TTCATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTAC 900 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 841 TTCATGGAGCAGTTTACAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTAC 900 

Qy 901 TTCAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCC 960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 

Db 901 TTCAAGCGGCTCATTCAGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCC 960 

Qy 961 TCAGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCC 1020 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 961 TCAGCCCTGTCAGAACATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCC 1020 

Qy 1021 GAC AGC GAGC C AGT C CT AGAGAAG GAT GACCT CAT G GACAT GGAT G C CT C T CAG CAGAAT 1080 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1021 GACAG CGAGC C AGT C CT AGAGAAG GAT GACCT CAT G GACAT G GAT G C CT CT CAG CAGAAT 1080 

Qy 1081 T TAT T T GACAACAAGT TT GAT GACAT C T T T GG CAGT T CAT T CAGCAGT GAT C C CT T CAAT 1140 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I 
Db 10 81 T TAT T T GACAACAAGT T T GAT GACAT C TT T GG C AGTT CAT T CAGCAGT GAT C C CTT CAAT 1140 

Qy 1141 TT CAACAGT CAAAAT G GT GT GAACAAG GAT GAGAAG GAC CACT TAATT GAGC GACTAT AC 1200 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 
Db 1141 TT CAACAGT CAAAAT G GT GT GAACAAG GAT GAGAAG GAC CACT TAAT T GAG C GACTAT AC 1200 

Qy 1201 AGAG AGAT CAGT G GAT T GAAG G C AC AG C T AG AAAAC AT G AAG AC T GAG AG C CAG C G G GT T 1260 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1201 AGAGAGAT CAGT GGAT T GAAG GCACAGCTAGAAAACAT GAAGACT GAGAGCCAGCGGGTT 1260 

Qy 1261 GTGCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCAC 1320 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 12 61 GTGCTGCAGCTGAAGGGCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCAC 1320 

Qy 1321 CTGCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGG 138 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1321 CTGCGGCAGCAGGCGGCCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGG 1380 

Qy 1381 AGGCAGCGGGAGGACACCGAGAAGGCTCAGCGGAGCCTGTCTGAGATAGAAAGGAAAGCT 144 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1381 AGG C AGC G G GAGGACAC C GAGAAGGC T CAGC G GAGC CT GT CT GAGAT AGAAAG GAAAG CT 1440 

Qy 1441 CAAGC CAAT GAACAGC GAT AT AGCAAGCTAAAGGAGAAGT ACAGC GAG CT GGTT CAGAAC 1500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 41 CAAGC CAAT GAACAG C GAT AT AGCAAGCT AAAGGAGAAGTACAG C GAG CT G GTT CAGAAC 1500 

Qy 1501 CAC GCT GAC CT G CT G CG GAAGAAT GCAGAGGT GAC CAAACAGGT GT C CAT GGC C AGACAA 1560 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1501 CAC GCT GAC CTGCTGCG GAAGAAT GC AG AG GT GAC C AAAC AG G T GT C CAT GGC C AGACAA 1560 

Qy 1561 G C C CAGGT AGAT T T G GAAC GAGAGAAAAAAGAG CT G GAG GAT T C GT T G GAG C G CAT CAGT 1620 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
Db 1561 G C C CAG GT AGAT T T GGAAC GAGAGAAAAAAGAG CT G GAG GAT T C GT T G GAG C GC ATCAGT 1620 

Qy 1621 GAC CAGG G C CAGC GGAAGACT CAAGAACAGCT G GAAGT T C TAGAGAG CTT GAAG CAGGAA 1680 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 



I 1 1 1 1 I 1 1 1 I 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 I 1 1 1 1 1 1 I 1 1 1 1 I I 1 1 1 1 1 I I 1 1 1 1 1 

1621 GACCAGGGCCAGCGGAAGACTCAAGAACAGCTGGAAGTTCTAGAGAGCTTGAAGCAGGAA 1680 

1681 CTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAG 1740 

I I I I I I I I I I I I I I I I i I I I I I I I I I I I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I 
1681 CTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAG 174 0 

1741 TCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTG 1800 

I I I I I I I II I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
1741 TCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACAGCCTGGTG 1800 

1801 AGT GG C G CAG CT CAT AG GGAGGAG GAAT T AT CT GCTCTTCG GAAAGAACT G C AGGACACT 1860 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
1801 AGTGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACT 1860 

1861 CAG CT CAAACT GGC CAG CACAGAGGAAT CTAT GT GCCAG CTT GC CAAAGAC CAAC GAAAA 1920 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 CAGCTCAAACTGGCCAGCACAGAGGAATCTATGTGCCAGCTTGCCAAAGACCAACGAAAA 1920 

1921 ATG CTT CT G GT G G G GT C CAGGAAG G C T G C GGAG CAGGT GAT ACAAGAC G C C CT GAAC CAG 1980 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1921 AT GCTTCTGGTGGG GT C CAGGAAGGCT G C GGAG CAGGT GAT ACAAGAC G C C CT GAAC CAG 1980 

1981 CTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTC 204 0 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
1981 CTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTC 204 0 

2041 ACAT C CAT T T C CAG CT GCAT C GAGCAACT G GAGAAAAGC T G GAG CC AGT AT CT GG C C T GC 2100 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2041 ACAT C CAT T T C C AGCT GCAT C GAG CAACT G GAGAAAAGC T G GAG C C AGT AT CTGGCCTGC 2100 

2101 CCAGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGAC 2160 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2101 C CAGAAGACAT C AGT G GACTT CT C CAT T CCATAAC CCT G CT GG C CCACT T GAC CAG C GAC 2160 

2161 GCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTG 222 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2161 GCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTG 222 0 

2221 ACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAA 2280 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2221 ACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAA 228 0 

22 81 GAGGGAAG C CTT GAGAAT G CC GACAGCACAGC CAT GAG GAACT G CCT GAGCAAGAT CAAG 234 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2281 GAGG GAAG C CTT GAGAAT G CC GACAGCACAGC CAT GAG GAACT G CCT GAGCAAGAT CAAG 2340 

2341 G CCAT C GGCGAG GAG CTCCTGCC CAGGG GACT GGACAT CAAG C AGGAG GAG CT GGGG GAC 2400 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

2341 G C CAT C G G C GAG GAG CT C CT G C C CAG G G GACT G GACAT CAAG C AGGAG GAG CT GGGG GAC 2400 

24 01 CTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATA 24 60 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
24 01 CT G GT G GACAAG GAGAT GG C GGC CACTT CAG C T G C T ATT GAAACT G C CAC G GC CAGAAT A 2460 

24 61 GAG GAGAT G CT C AG C AAAT C C C GAG CAG GAGAC AC AG GAGT C AAAT T G GAG GT GAAT GAA 2520 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2461 GAGGAGAT GCT C AGCAAAT C C C GAGCAG GAGACACAGGAGT CAAATT GGAG GT GAAT GAA 2520 

Qy 2521 AGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCT 2580 

I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 AGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCT 2580 

Qy 2581 AAG GAC CT C CAGAGAGAGATT GTG GAGAGC GG CAGGG GT ACAGCAT C CC CTAAAGAGTT T 2640 

I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AAG GAC CT C CAGAGAGAGATTGT G GAGAGC GG CAG GG GTACAG CAT C CC CTAAAGAGT T T 2 640 

Qy 2641 TATGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGG 2700 

I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 TATGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGG 2700 

Qy 27 01 GGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAG 2760 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 2701 GGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAG 27 60 

Qy 2761 GAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCC 2 820 

I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 GAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCC 2820 

Qy 2 821 AAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGA 2880 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 AAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGA 2880 

Qy 2 8 81 GTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAA 2 94 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2881 GTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCACAGATCGAA 294 0 

Qy 2941 GAGACAGACAACAT GGACTTCT CAAGCAT GACGCT GACACAGATCAAACGC CAAGAGAT G 3000 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2941 GAGACAGACAACAT GGACTT CT CAAGCAT GACGCT GACACAGATCAAACGC CAAGAGAT G 3000 

Qy 3001 GATT CT CAG GT TAG G GT G CT AGAG CTAGAAAAT GAAT T G CAGAAG GAG C GT CAAAAACT G 3060 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3001 GATTCTCAGGTTAGGGTGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTG 3060 

Qy 3061 GGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGA 3120 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3061 GGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGA 3120 

Qy 3121 ACAGAG G CAT C T C C AC CT ACAC T GCAAGAAGT G GTAAC C GAAAAAGAATAGAGC CAAAC C 3180 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3121 ACAGAG GC AT C T C C AC CT ACAC TGCAAGAAGT G GTAAC C GAAAAAGAAT AGAG C CAAAC C 3180 

Qy 3181 AACACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGC 324 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3181 AACACCCCATATGTCAGTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGC 3240 

Qy 32 41 CACAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGA 3300 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3241 CACAGGCCAAATCCTTGGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGA 3300 

Qy 3301 G GAC AT G CAT GACAC T T C CAAAGACT C C CT C CAT AG C GACAC CCTTTCTGTTTG GAC C CA 3360 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 33 01 GGACATGCATGACACTTCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACCCA 3360 



Qy 3361 TGGATTTCCACTGCTTCTTATGGTGGTTGGTTGGGTTTTTTGGTTTTGTTTTTTTTTTTT 3420 

I I I I I I I I I I I I I I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I Ill 

Db 3361 TGGATTTCCACTGCTTCTTATGGTGGTTGGTTGGGTTTTTTGGTTTTGTTTTTTTTTTTT 3420 

Qy 3421 AAGTTTCACTCACATAGCCAACTCTCCCAAAGGGCACACCCCTGGGGCTGAGTCTCCAGG 3480 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3421 AAGTTTCACTCACATAGCCAACTCTCCCAAAGGGCACACCCCTGGGGCTGAGTCTCCAGG 34 80 

Qy 3481 GCCCCCCAACTGTGGTAGCTCCAGCGATGGTGCTGCCCAGGCCTCTCGGTGCTCCATCTC 354 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 34 81 GCCCCCCAACTGTGGTAGCTCCAGCGATGGTGCTGCCCAGGCCTCTCGGTGCTCCATCTC 354 0 

Qy 3541 CGCCTCCACACTGACCAAGTGCTGGCCCACCCAGTCCATGCTCCAGGGTCAGGCGGAGCT 3600 

I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 3541 CGCCTCCACACTGACCAAGTGCTGGCCCACCCAGTCCATGCTCCAGGGTCAGGCGGAGCT 3600 

Qy 3601 GCTGAGTGACAGCTTTCCTCAAAAAGCAGAAGGAGAGTGAGTGCCTTTCCCTCCTAAAGC 3660 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 

Db 3601 GCTGAGTGACAGCTTTCCTCAAAAAGCAGAAGGAGAGTGAGTGCCTTTCCCTCCTAAAGC 3660 

Qy 3661 T GAAT C C C G G C GGAAAG CCTCTGTCCGCCTT T AC AAG GG AGAAGACAACAGAAAGAG G GA 372 0 

I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3661 T GAAT C C C GG C G GAAAG C CT C T GT C C G C CTTT ACAAG GGAGAAGACAACAGAAAGAGG GA 372 0 

Qy 3721 CAAGAG GGT T CACACAG C C CAGT T C C CGT GAC GAG G CT CAAAAACT T GAT CACAT G CT T G 3780 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 3721 CAAGAG G GT T CACACAG C C CAGT T C C C GT GAC GAG G CT CAAAAACT T GAT CACAT G CT T G 3780 

Qy 3781 AATGGAGCTGGTGAGATCAACAACACTACTTCCCTGCCGGAATGAACTGTCCGTGAATGG 384 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3781 AATGGAGCTGGTGAGATCAACAACACTACTTCCCTGCCGGAATGAACTGTCCGTGAATGG 384 0 

Qy 3841 TCTCTGTCAAGCGGGCCGTCTCCCTTGGCCCAGAGACGGAGTGTGGGAGTGATTCCCAAC 3900 

I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 3841 TCTCTGTCAAGCGGGCCGTCTCCCTTGGCCCAGAGACGGAGTGTGGGAGTGATTCCCAAC 3900 

Qy 3901 TCCTTTCTGCAGACGTCTGCCTTGGCATCCTCTTGAATAGGAAGATCGTTCCACCTTCTA 3960 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I 
Db 3901 TCCTTTCTGCAGACGTCTGCCTTGGCATCCTCTTGAATAGGAAGATCGTTCCACCTTCTA 3960 

Qy 3961 C G C AAT T GAC AAAC C C G GAAG AT C AGAT G C AAT T G C T C C CAT C AG G GAAGAAC C CT AT AC 4020 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 39 61 C G C AAT T GAC AAAC C C G GAAGAT C AGAT G C AAT T G C T C C CAT C AG G GAAGAAC C CT AT AC 4 020 

Qy 4 021 TTGGTTTGCTACCCTTAGTATTTATTACTAACCTCCCTTAAGCAGCAACAGCCTACAAAG 408 0 

I I I I I I I I I II I I I I I I II I I I I I I I I II I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 021 TTGGTTTGCTACCCTTAGTATTTATTACTAACCTCCCTTAAGCAGCAACAGCCTACAAAG 4 08 0 

Qy 4081 AGATGCTTGGAGCAATCAGAACTTCAGGTGTGACTCTAGCAAAGCTCATCTTTCTGCCCG 414 0 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4 081 AGATGCTTGGAGCAATCAGAACTTCAGGTGTGACTCTAGCAAAGCTCATCTTTCTGCCCG 414 0 

Qy 4141 GCTACATCAGCCTTCAAGAATCAGAAGAAAGGCCAAGGTGCTGGACTGTTACTGACTTGG 42 00 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 4141 GCTACATCAGCCTTCAAGAATCAGAAGAAAGGCCAAGGTGCTGGACTGTTACTGACTTGG 4200 



Qy 4201 
Db 4201 



AT C C CAAAG CAAG GAGAT CATTTG GAGCT CT T GG GT CAGAGAAAAT GAGAAAGGACAGAG 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I 

AT C C CAAAG CAAG GAGAT CATTTG GAGCT CT T GG GT CAGAGAAAAT GAGAAAGGACAGAG 



4260 
4260 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



42 61 CCAGCGGCTCCAACTCCTTTCAGCCACATGCCCCAGGCTCTCGCTGCCCTGTGGACAGGA 4 320 

I I I I I I I I I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 

42 61 CCAGCGGCTCCAACTCCTTTCAGCCACATGCCCCAGGCTCTCGCTGCCCTGTGGACAGGA 4320 

4 321 T GAG GACAGAG GG C ACAT GAACAG CT TGC CAG GGAT G G GCAGC CCAACAGCACT T T T C CT 4 380 

II I II I I I I I I II I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I II I 

4 321 TGAGGACAGAGGGCACATGAACAGCTTGCCAGGGATGGGCAGCCCAACAGCACTTTTCCT 4380 

4 381 CTTCTAGATGGACCCCAGCATTTAAGTGACCTTCTGATCTTGGGAAAACAGCGTCTTCCT 4440 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4381 CTTCTAGATGGACCCCAGCATTTAAGTGACCTTCTGATCTTGGGAAAACAGCGTCTTCCT 44 40 

4441 TCTTTATCTATAGCAACTCATTGGTGGTAGCCATCAAGCACTTCGGAATTCCTGCAGCCC 4500 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
44 41 T CT T TAT CTAT AGCAACT CATT GGT G GTAGC CAT CAAGC AC TT CG GAATT C CT G CAG C C C 4 500 

4501 GGGCGGCCGCTCGAGCATGCNNTAGAGGGCCCTA 4534 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
4501 GGGCGGCCGCTCGAGCATGCNNTAGAGGGCCCTA 4534 
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ALIGNMENTS 



RESULT 1 

US-10-955-054A-21 

Sequence 21, Application US/10955054A 
Publication No. US200502 66420A1 
GENERAL INFORMATION: 
APPLICANT: PUSZTAI, LAJOS 
APPLICANT: SYMMANS, W. FRASER 
APPLICANT: HESS, KENNETH R. 
APPLICANT: AYERS, MARK 
APPLICANT: STEC, JAMES 

TITLE OF INVENTION: MULTIGENE PREDICTORS OF RESPONSE TO CHEMOTHERAPY 
FILE REFERENCE: UTXC:880US 

CURRENT APPLICATION NUMBER: US/10/ 955, 054A 
CURRENT FILING DATE: 2004-09-30 
NUMBER OF SEQ ID NOS : 195 
SOFTWARE: Patentln Ver. 2.1 
SEQ ID NO 21 
LENGTH: 7239 
TYPE: DNA 

ORGANISM: Homo sapiens 
US-10-955-054A-21 

Query Match 71.6%; Score 3245; DB 6; Length 7239; 

Best Local Similarity 99.9%; Pred. No. 0; 

Matches 3345; Conservative 0; Mismatches 2; Indels 0; Gaps 0; 

Qy 17 CGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATGGATCGGATGGCCAGCT 7 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I | I | | | | | | 
Db 1 CGGGGCAGCCGAGGGCCCCTGACTCGGCTCCTCGCGGCGACATGGATCGGATGGCCAGCT 60 

Qy 77 CCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGGCGCGGGGTCGGCGCTG 136 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 61 CCATGAAGCAGGTGCCCAACCCACTGCCCAAGGTGCTGAGCCGGCGCGGGGTCGGCGCTG 120 

Qy 137 GGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACTGTCAGCATCAATAAGG 196 

I II I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 121 GGCTGGAGGCGGCGGAGCGCGAGAGCTTCGAGCGGACTCAGACTGTCAGCATCAATAAGG 18 0 

Qy 197 CCATTAATACGCAGGAAGTGGCTGTAAAGGAAAAACACGCCAGAACGTGCATACTGGGCA 256 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 181 C CAT T AAT AC G C AG GAAG T G G C T G T AAAG GAAAAAC AC G C C AGAAC GT G CAT AC T G G G C A 24 0 

Qy 257 CCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCGCCTGCCTCTGTCTA 316 

I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 241 CCCACCATGAGAAAGGGGCACAGACCTTCTGGTCTGTTGTCAACCGCCTGCCTCTGTCTA 300 



Qy 



317 GCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACTCCTCCGAGATGGAC 376 



1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 1 

Db 301 GCAACGCAGTGCTCTGCTGGAAGTTCTGCCATGTGTTCCACAAACTCCTCCGAGATGGAC 360 

Qy 377 ACCCGAACGT CCTGAAGGACT CT CT GAGATACAGAAATGAATTGAGTGACATGAGCAGGA 4 36 

I II I I I I I M I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 
Db 361 ACCCGAACGT CCTGAAGGACT CTCT GAGATACAGAAATGAATT GAGTGACATGAGCAGGA 420 

Qy 437 TGTGGGGCTACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTACCTGAAACTGCTAA 4 96 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 
Db 421 TGTGGGGCCACCTGAGCGAGGGGTATGGCCAGCTGTGCAGCATCTACCTGAAACTGCTAA 4 80 

Qy 4 97 GAAC C AAGAT G GAGT AC C ACAC C AAAAAT C C C AG GT T C C C AG G C AAC CT GCAGAT GAGT G 556 

I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 481 GAAC C AAGAT G GAGT AC C ACAC C AAAAAT C C C AG G T T C C C AG GCAAC C T G C AGAT GAGT G 540 

Qy 557 ACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTTTCCCAGTTAACAGTGG 616 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 541 ACCGCCAGCTGGACGAGGCTGGAGAAAGTGACGTGAACAACTTTTTCCAGTTAACAGTGG 600 

Qy 617 AGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACAGTATTCAACTCCCTGG 67 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 601 AGATGTTTGACTACCTGGAGTGTGAACTCAACCTCTTCCAAACAGTATTCAACTCCCTGG 660 

Qy 677 ACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCTCGCCCCGCTGATCC 736 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 661 ACATGTCCCGCTCTGTGTCCGTGACGGCAGCAGGGCAGTGCCGCCTCGCCCCGCTGATCC 720 

Qy 737 AGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCTTCTCTTCAAACTCC 7 96 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 721 AGGTCATCTTGGACTGCAGCCACCTTTATGACTACACTGTCAAGCTTCTCTTCAAACTCC 780 

Qy 7 97 ACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTTCATGGAGCAGTTTA 856 

I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 7 81 ACTCCTGCCTCCCAGCTGACACCCTGCAAGGCCACCGGGACCGCTTCATGGAGCAGTTTA 84 0 

Qy 857 CAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTACTTCAAGCGGCTCATTC 916 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 841 CAAAGTTGAAAGATCTGTTCTACCGCTCCAGCAACCTGCAGTACTTCAAGCGGCTCATTC 900 

Qy 917 AGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTCAGCCCTGTCAGAAC 976 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 901 AGATCCCCCAGCTGCCTGAGAACCCACCCAACTTCCTGCGAGCCTCAGCCCTGTCAGAAC 960 

Qy 977 ATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGACAGCGAGCCAGTCC 1036 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 9 61 ATATCAGCCCTGTGGTGGTGATCCCTGCAGAGGCCTCATCCCCCGACAGCGAGCCAGTCC 1020 

Qy 1037 TAGAGAAG GAT GAC CT CAT GGACAT G GAT GC CT CT CAGCAGAAT TT ATT T GACAACAAGT 1096 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1021 TAGAGAAG GAT GAC C T CAT GGACAT G GAT GC C T CT CAGCAGAAT TT ATT T GACAACAAGT 1080 

Qy 1097 TT GAT GAC AT CT TT G GCAGT T CAT T CAG CAGT GAT C C CT T CAAT TT CAACAGT CAAAAT G 1156 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1081 T T GAT GAC AT C T T T G G CAG T T CAT T CAG CAGT GAT C C C T T CAAT T T C AA C A G T CAAAAT G 1140 

Qy 1157 GT GT GAACAAGGAT GAGAAGGAC CACT T AAT T GAG CGAC T ATACAGAGAGAT CAGT G GAT 1216 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I 



Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 
Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 



1141 GT GT GAACAAG GAT GAGAAGGACCACT TAAT T GAG CGACTATACAGAGAGAT CAGT G GAT 1200 

1217 T GAAGG CACAG CTAGAAAACAT GAAGACT GAGAGCCAG C GG GT TGT G CT GCAGCT GAAG G 127 6 

I I I I I I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 1 I I I I I I I 11 I I I I I 

1201 T GAAGG CACAG CTAGAAAACAT GAAGACT GAGAGCCAGCGGGTTGTGCT GCAGCT GAAGG 1260 

1277 GCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCACCTGCGGCAGCAGGCGG 1336 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1261 GCCACGTCAGCGAGCTGGAAGCAGATCTGGCCGAGCAGCAGCACCTGCGGCAGCAGGCGG 1320 

1337 CCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAGGCAGCGGGAGGACA 1396 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I 

1321 CCGACGACTGTGAATTCCTGCGGGCAGAACTGGACGAGCTCAGGAGGCAGCGGGAGGACA 1380 

1397 C C GAGAAG GC T C AG C GGAGC CT GT CT GAGAT AGAAAG GAAAGCT CAAGC CAAT GAACAG C 1456 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

13 81 C C GAGAAGGCT C AGC G GAGC CT GT CT GAGAT AGAAAG GAAAGCT CAAGC CAAT GAACAG C 144 0 

1457 GATATAGCAAGCTAAAGGAGAAGTACAGCGAGCTGGTTCAGAACCACGCTGACCTGCTGC 1516 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

14 41 GATATAGCAAGCTAAAGGAGAAGTACAGCGAGCTGGTTCAGAACCACGCTGACCTGCTGC 1500 

1517 G GAAGAAT G CAGAGGT GACCAAACAG GT GT C CAT G G C CAGACAAG CC C AGGT AGATT T G G 1576 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1501 G GAAGAAT G CAGAGGT GACCAAACAG GT GT C CAT G GC CAGACAAG CC C AGGT AGATT T G G 1560 

1577 AAC GAGAGAAAAAAGAGCT GGAGGAT T C GT T G GAGC G CAT CAGT GAC C AGG GC CAG C GGA 1636 

I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1561 AAC GAGAGAAAAAAG AG CT GGAG GAT T C GT T G GAGC G CAT CAGT GAC CAG G G C CAG C G G A 1620 

1637 AGACT CAAGAACAGCT GGAAGTTCTAGAGAGCTT GAAGCAGGAACTT GC CACAAGC CAAC 1696 

I I I I I I II I I I I I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I 

1621 AGACT CAAGAACAG CT GGAAGT T CT AGAGAGCT T GAAG CAG GAACTT GC CACAAG C CAAC 1680 

1697 GGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTCAGAAGCAAACTGGG 1756 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1681 GGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTTCTGCCCAGTCAGAAGCAAACTGGG 1740 

1757 CAG C C GAGT T C GC C GAGCTAGAGAAGGAG C G G GACAG C CT G GT GAGT GG C G CAG C T CAT A 1816 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1741 CAG C C GAGT T C GC C GAGCTAGAGAAGGAG C G G GACAG C CT G GT GAGT GGC G CAG C T CAT A 18 00 

1817 G GGAG GAG GAAT T AT CT G CT CT T C GGAAAGAACT G CAG GACACT CAG CT CAAAC T G G C CA 1876 

I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

18 01 GGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGCAGGACACTCAGCTCAAACTGGCCA 18 60 

1877 G CAC AGAG GAAT CT AT GT GC C AGCT T GC CAAAGAC CAAC GAAAAAT G CT T CT G GT G G GGT 193 6 

I I I I I II I I II I I I I I I I I I I I I I II I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1861 G CACAGAG GAAT CT AT GT GC CAGCT T G C CAAAGAC CAAC GAAAAAT GCTTCTGGTGGGGT 1920 

1937 C CAG GAAG GCT GC G GAGCAG GT GAT ACAAGAC GC C CT GAAC CAGCTT GAAGAACCT C CT C 1996 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

1921 C CAG GAAG G CT G C G GAG CAG GT GAT ACAAGAC GC C CT GAAC CAGCTT GAAGAAC C T C CT C 198 0 

1997 TCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCACATCCATTTCCAGCT 2056 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I II I I I I I I I I I I I I I I I I I I I I I I I II I 

1981 TCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCTCCACGGTCACATCCATTTCCAGCT 204 0 



Qy 

Db 



2057 GCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGCCCAGAAGACATCAGTG 2116 

1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 
2041 GCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATCTGGCCTGCCCAGAAGACATCAGTG 2100 



Qy 2117 GACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGACGCCATTGCTCATGGTG 2176 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2101 GACTTCTCCATTCCATAACCCTGCTGGCCCACTTGACCAGCGACGCCATTGCTCATGGTG 2160 

Qy 2177 CCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTGACCGAGGCCTGTAAGC 2236 

I I I I I I I I I I I I I I II II I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2161 CCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCGACTCACTGACCGAGGCCTGTAAGC 2220 

Qy 2237 AGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGAGGGAAGCCTTGAGA 2296 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I 
Db 2221 AGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCCTGGAGGAAGAGGGAAGCCTTGAGA 228 0 

Qy 2297 AT G C C GACAG CACAGC CAT GAG GAACTGC CT GAGCAAGAT CAAG G C CAT C GG C GAG GAGC 2356 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2281 AT GC C GACAG CACAGC CAT GAG GAACT GC CT GAGCAAGAT CAAGGC C AT C G G C GAG GAGC 234 0 

Qy 2357 TCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGCTGGGGGACCTGGTGGACAAGGAGA 2416 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2341 T C C T GC C C AGG GGACT G GAC AT CAAG CAG GAG GAG CT G GG G GAC CT G GT G GACAAG GAGA 2400 

Qy 2417 TGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATAGAGGAGATGCTCAGCA 247 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 01 TGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGGCCAGAATAGAGGAGATGCTCAGCA 24 60 

Qy 24 77 AAT C C C GAGCAGGAGACACAGGAGT CAAAT T G GAGGT GAAT GAAAG GAT CCTTGGTTGCT 2536 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 24 61 AAT C C C GAG CAG GAGACACAG GAGT CAAAT T G GAGGT GAAT GAAAG GAT CCTTGGTTGCT 2520 

Qy 2537 GT AC CAG C C T CAT GCAAG CT AT T CAG GT G C T CAT C GT G G C C T CT AAG GAC C T C C AG AGAG 2596 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2521 GTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCGTGGCCTCTAAGGACCTCCAGAGAG 258 0 

Qy 2 597 AGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTAAAGAGTTTTATGCCAAGAACTCTC 2 656 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2581 AGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTAAAGAGTTTTATGCCAAGAACTCTC 2 64 0 

Qy 2657 GATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGGAGCCACTGTCATGG 2716 

I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2641 GATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTGTGGGCTGGGGAGCCACTGTCATGG 2700 

Qy 2717 TGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAGGAGCTAATGGTGTGTT 277 6 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 27 01 TGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGAAATTTGAGGAGCTAATGGTGTGTT 27 60 

Qy 27 77 CTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAAGGTGAAAGCTGATA 2836 

I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2761 CTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGGCTGCATCCAAGGTGAAAGCTGATA 2820 

Qy 2837 AGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGTGAACCAGGCCACTG 2896 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2821 AGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCTCTCGGGGAGTGAACCAGGCCACTG 2880 



Qy 2897 
Db 2881 



CCGGCGTTGTGGCCT C AAC CAT T T C C G G C AAAT C AC A GAT C G AAGAG AC A G AC AA C AT G G 
I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I 
C C GGC GTT GT G GC CT CAAC CAT T T C CGGCAAATCACAGAT C GAAGAGACAGACAAC AT GG 



2956 
2940 



Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 

Db 

Qy 
Db 



2957 ACT TCT CAAGC AT GAC GC T GAC ACAGAT CAAACG C CAAGAGAT G GATT CT CAGGTTAGGG 3016 

I I I I I II I I I I I I I I I I I I i I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
2941 ACTTCTCAAGCATGACGCTGACACAGATCAAACGCCAAGAGATGGATTCTCAGGTTAGGG 3000 

3017 TGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTGGGAGAGCTTCGGAAAA 3076 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I 
3001 TGCTAGAGCTAGAAAATGAATTGCAGAAGGAGCGTCAAAAACTGGGAGAGCTTCGGAAAA 3060 

3077 AGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAACAGAGGCATCTCCAC 3136 

I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
30 61 AGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGGAAGAAGGAACAGAGGCATCTCCAC 3120 

3137 C T ACACT G C AAGAAGT G GT AAC C GAAAAAGAAT AGAG C C AAAC CAAC AC C C CAT AT GT C A 3196 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

3121 CTACACT GCAAGAAGT G GTAAC C GAAAAAGAATAGAGC CAAAC C AACAC C C CAT AT GT CA 3180 

3197 GTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGCCACAGGCCAAATCCTT 3256 

I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I 
3181 GTGTAAATCCTTGTTACCTATCTCGTGTGTGTTATTTCCCCAGCCACAGGCCAAATCCTT 3240 

3257 GGAGTCCCAGGGGCAGCCACACCACTGCCATTACCCAGTGCCGAGGACATGCATGACACT 3316 

I I I I I I I I I I I I I I I I I II I I I II I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I 
3241 GGAGT C C C AGG GG CAG C CACAC CACT GC CAT TAC CCAGTG C C GAG GAC AT GCAT GACAC T 3300 

3317 TCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACCCATGG 3363 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
3301 TCCAAAGACTCCCTCCATAGCGACACCCTTTCTGTTTGGACCCATGG 3347 



RESULT 2 

US-10-750-185-64852 

Sequence 64852, Application US/10750185 
Publication No. US20050260603A1 
GENERAL INFORMATION : 
APPLICANT: MMI GENOMICS, INC. 
APPLICANT: DeNISE, Sue K. 
APPLICANT: KERR, Richard 
APPLICANT: ROSENFELD, David 
APPLICANT: HOLM, Tom 
APPLICANT: BATES, Stephen 
APPLICANT: FANTIN, Dennis 

TITLE OF INVENTION: COMPOSITIONS FOR INFERRING BOVINE TRAITS 
FILE REFERENCE: MMI1100-2 

CURRENT APPLICATION NUMBER: US/ 10/750, 185 
CURRENT FILING DATE: 2003-12-31 
PRIOR APPLICATION NUMBER: US 60/437,482 
PRIOR FILING DATE: 2002-12-31 
NUMBER OF SEQ ID NOS : 64922 
SOFTWARE: PatentIN version 3.1 
SEQ ID NO 64852 
LENGTH: 3391 
TYPE: DNA 

ORGANISM: Bovine 19866880385058 



US-10-750-185-64852 



Query Match 0.7%; Score 30; DB 6; Length 3391; 

Best Local Similarity 100.0%; Pred. No. 0.00021; 

Matches 30; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 660 AGTATTCAACTCCCTGGACATGTCCCGCTC 689 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 669 AGTATTCAACTCCCTGGACATGTCCCGCTC 698 



RESULT 3 

US-10-750-623-64852 

Sequence 64852, Application US/10750623 
Publication No. US20050287531A1 
GENERAL INFORMATION: 
APPLICANT: MMI GENOMICS, INC. 
APPLICANT: DeNISE, Sue K. 
APPLICANT: KERR, Richard 
APPLICANT: ROSENFELD, David 
APPLICANT: HOLM, Tom 
APPLICANT: BATES, Stephen 
APPLICANT: FANTIN, Dennis 

TITLE OF INVENTION: METHODS AND SYSTEMS FOR INFERRING BOVINE TRAITS 
FILE REFERENCE: MMI1100-1 

CURRENT APPLICATION NUMBER: US/10/750,623 
CURRENT FILING DATE: 2003-12-31 
PRIOR APPLICATION NUMBER: US 60/437,482 
PRIOR FILING DATE: 2002-12-31 
NUMBER OF SEQ ID NOS : 64922 
SOFTWARE: PatentIN version 3.1 
SEQ ID NO 64852 
LENGTH: 3391 
TYPE: DNA 

ORGANISM: Bovine 198 6688 0385058 
US-10-750-623-64852 



Query Match 0.7%; Score 30; DB 6; Length 3391; 

Best Local Similarity 100.0%; Pred. No. 0.00021; 

Matches 30; Conservative 0; Mismatches 0; Indels 0; 



Gaps 



0; 



Qy 

Db 



660 AGTATTCAACTCCCTGGACATGTCCCGCTC 68 9 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
669 AGTATTCAACTCCCTGGACATGTCCCGCTC 698 



RESULT 4 

US-10-775-169-259 

Sequence 259, Application US/10775169 
Publication No. US20050287532A9 
GENERAL INFORMATION: 
APPLICANT: Wyeth 

APPLICANT: Burczynski, Michael 
APPLICANT: Twine, Natalie 
APPLICANT: Dorner, Andrew 
APPLICANT: Trepicchio, William 

TITLE OF INVENTION: Method for Monitoring Drug Activities In Vivo 



; FILE REFERENCE: AM101080 (031896-013000) 
; CURRENT APPLICATION NUMBER: US/10/775,169 
; CURRENT FILING DATE: 2004-02-11 
; NUMBER OF SEQ ID NOS : 5278 

SOFTWARE: Patent In version 3.2 
; SEQ ID NO 259 
LENGTH: 44 57 
TYPE: DNA 
; ORGANISM: Homo sapiens 
US-10-775-169-259 

Query Match 0.6%; Score 29; DB 6; Length 4457; 

Best Local Similarity 100.0%; Pred. No. 0.00063; 

Matches 29; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 2 680 GCCTCCAAGGCTGTGGGCTGGGGAGCCAC 2708 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2670 GCCTCCAAGGCTGTGGGCTGGGGAGCCAC 2698 



RESULT 5 

US-11-121-849-111397 

; Sequence 111397, Application US/11121849 
; Publication No. US20050272080A1 
; GENERAL INFORMATION: 
; APPLICANT: John Palma 

TITLE OF INVENTION: Methods of Genetic Analysis of Formalin Fixed Paraffin 
Embedded Samples on 

; TITLE OF INVENTION: Microarrays 
; FILE REFERENCE: 3684.1 

; CURRENT APPLICATION NUMBER: US/11/121,849 
; CURRENT FILING DATE: 2005-05-03 

PRIOR APPLICATION NUMBER: 60/567,949 
; PRIOR FILING DATE: 2004-05-03 
; NUMBER OF SEQ ID NOS: 673904 

; SOFTWARE: Microarray Probe Sequence Listing Generator V 1.1 
; SEQ ID NO 111397 

LENGTH: 25 
; TYPE: DNA 
; ORGANISM: Homo sapien 
US-11-121-849-111397 

Query Match 0.6%; Score 25; DB 7; Length 25; 

Best Local Similarity 100.0%; Pred. No. 0.069; 

Matches 25; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 4184 GACT GT T ACT GACT T G GAT C C CAAA 4208 

I I I I I I I I! II I I I I I I I I I I I II I 
Db 1 GACT GTT AC T GACT T G GAT C C CAAA 25 



RESULT 6 

US-11-121-849-111398 

; Sequence 111398, Application US/11121849 
; Publication No. US20050272080A1 
; GENERAL INFORMATION: 
; APPLICANT: John Palma 



; TITLE OF INVENTION: Methods of Genetic Analysis of Formalin Fixed Paraffin 
Embedded Samples on 

; TITLE OF INVENTION: Microarrays 
; FILE REFERENCE: 3684.1 

; CURRENT APPLICATION NUMBER: US/11/121, 849 

; CURRENT FILING DATE: 2005-05-03 

; PRIOR APPLICATION NUMBER: 60/567,949 

; PRIOR FILING DATE: 2004-05-03 

; NUMBER OF SEQ ID NOS : 673904 

; SOFTWARE: Microarray Probe Sequence Listing Generator V 1.1 
; SEQ ID NO 111398 

LENGTH: 25 

TYPE: DNA 
; ORGANISM: Homo sapien 
US-11-121-849-111398 

Query Match 0.6%; Score 25; DB 7; Length 25; 

Best Local Similarity 100.0%; Pred. No. 0.069; 

Matches 25; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 4221 TTTGGAGCTCTTGGGTCAGAGAAAA 4245 

I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 TTTGGAGCTCTTGGGTCAGAGAAAA 25 



RESULT 7 

US-11-121-849-111399 

; Sequence 111399, Application US/11121849 
; Publication No. US2005027208 0A1 
; GENERAL INFORMATION: 
; APPLICANT: John Palma 

TITLE OF INVENTION: Methods of Genetic Analysis of Formalin Fixed Paraffin 
Embedded Samples on 

; TITLE OF INVENTION: Microarrays 
; FILE REFERENCE: 3684.1 

; CURRENT APPLICATION NUMBER: US/11/121,849 

; CURRENT FILING DATE: 2005-05-03 

; PRIOR APPLICATION NUMBER: 60/567,949 

; PRIOR FILING DATE: 2004-05-03 

; NUMBER OF SEQ ID NOS: 673904 

; SOFTWARE: Microarray Probe Sequence Listing Generator V 1.1 
; SEQ ID NO 111399 

LENGTH: 25 

TYPE: DNA 

ORGANISM: Homo sapien 
US-11-121-849-111399 

Query Match 0.6%; Score 25; DB 7; Length 25; 

Best Local Similarity 100.0%; Pred. No. 0.069; 

Matches 25; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 42 97 GCTCTCGCTGCCCTGTGGACAGGAT 4321 

I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1 GCTCTCGCTGCCCTGTGGACAGGAT 25 



RESULT 8 



US-11-12 1-84 9-111400 

; Sequence 111400, Application US/11121849 
; Publication No. US20050272080A1 
; GENERAL INFORMATION : 
; APPLICANT: John Palma 

TITLE OF INVENTION: Methods of Genetic Analysis of Formalin Fixed Paraffin 
Embedded Samples on 

; TITLE OF INVENTION: Microarrays 
; FILE REFERENCE: 3684.1 

; CURRENT APPLICATION NUMBER: US/ 11/ 12 1 , 84 9 

; CURRENT FILING DATE: 2005-05-03 

; PRIOR APPLICATION NUMBER: 60/567,949 

PRIOR FILING DATE: 2004-05-03 
; NUMBER OF SEQ ID NOS : 673904 

SOFTWARE: Microarray Probe Sequence Listing Generator V 1.1 
; SEQ ID NO 111400 
LENGTH: 25 
TYPE: DNA 

ORGANISM: Homo sapien 
US-11-121-849-111400 

Query Match 0.6%; Score 25; DB 7; Length 25; 

Best Local Similarity 100.0%; Pred. No. 0.069; 

Matches 25; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 4323 AG GACAGAG GG C ACAT GAAC AG CTT 4347 

I I I I I II I I I I I I I I I I I I I I I I I I 
Db 1 AG GACAGAG G G C ACAT GAACAG CTT 25 

GenCore version 5.1.6 
Copyright (c) 1993 - 2006 Compugen Ltd. 



OM nucleic - nucleic search, using sw model 

Run on: January 10, 2006, 11:09:26 ; Search time 11009 Seconds 

(without alignments) 
19269.019 Million cell updates/sec 

Title: US-10- 007- 047-1 

Perfect score: 4534 

Sequence: 1 ccaagcttggtacccccggg gcatgcnntagagggcccta 4534 

Scoring table: OLIGO_NUC 

Gapop 60.0 , Gapext 60.0 

Searched: 41078325 seqs, 23393541228 residues 

Word size : 0 

Total number of hits satisfying chosen parameters: 82156650 

Minimum DB seq length: 0 

Maximum DB seq length: 2000000000 



Post-processing: Listing first 45 summaries 



Database : EST:* 

1: gb_estl:* 
2: gb_est2:* 
3: gb_est3:* 
4: gb_htc:* 
5: gb_est4:* 
6: gb_est5:* 
7: gb_est6:* 
8: gb_est7:* 
9: gb_gssl:* 
10: gb_gss2:* 
11: gb_gss3:* 

Pred. No. is the number of results predicted by chance to have a 
score greater than or equal to the score of the result being printed, 
and is derived by analysis of the total score distribution. 
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ALIGNMENTS 



RESULT 1 
DQ050139 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 



TITLE 

JOURNAL 
PUBMED 
REFERENCE 
AUTHORS 



TITLE 
JOURNAL 

COMMENT 



FEATURES 

source 



gene 



DQ050139 2730 bp DNA linear GSS 02-JUN-2005 

Homo sapiens HIP1 gene, VIRTUAL TRANSCRIPT, partial sequence, 
genomic survey sequence. 
DQ050139 

DQ050139.1 GI:66903338 
GSS. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleos tomi ; 
Mammalia; Eutheria; Euarchontoglires ; Primates; Catarrhini; 
Hominidae; Homo. 

1 (bases 1 to 2730) 

Nielsen, R. , Bus tamante, C . , Clark, A. G.. , Glanowski , S . , Sackton, T . B . , 

Hubisz,M. J. , Fledel-Alon, A. , Tanenbaum, D.M. , Civello, D. , 

White, T. J., Sninsky, J. J. , Adams, M.D. and Cargill,M. 

A Scan for Positively Selected Genes in the Genomes of Humans and 

Chimpanzees 

(er) PLoS Biol. 3 (6), E170 (2005) 
15869325 

2 (bases 1 to 2730) 

Nielsen, R. , Bus tamante, C . , Clark, A. G., Glanowski, S . , Sackton, T . B . , 
Hubisz,M.J., Fledel-Alon, A. , Tanenbaum, D . M. , Civello, D., 
White, T. J., Sninsky, J. J. , Adams, M.D. and Cargill,M. 
Direct Submission 

Submitted ( 05-MAY-2005 ) Celera Genomics, 45 West Gude Drive, 
Rockville, MD 20850, USA 

This sequence was made by sequencing genomic exons and ordering 
them based on alignment. Translation starts at the beginning of 
alignment . 

Location/Qualifiers 

1. .2730 

/organism= n Homo sapiens" 
/mol_type=" genomic DNA" 
/db_xref="taxon: 9606" 
/chromosome="7 " 
<1. .>2730 
/gene="HIPl" 
/locus_tag= n HC18136" 



ORIGIN 



Query Match 38.4%; Score 1739; DB 11; Length 2730; 

Best Local Similarity 100.0%; Pred. No. 0; 

Matches 1739; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 



Qy 1433 GGAAAGC T CAAG C CAAT GAACAGC GAT ATAGCAAG CTAAAG GAGAAGT ACAG C GAG CT GG 14 92 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I II I II I I I I I I I I I I 
Db 992 G GAAAG CT CAAGC CAAT GAACAG C GAT AT AG CAAG CTAAAG GAGAAGTACAGC GAGCT G G 1051 

Qy 1493 T T CAGAAC CAC G CT GAC CTG CT GC GGAAGAAT G CAGAGGT GAC CAAACAG GT GT CCAT G G 1552 

I 1 I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1052 TT CAGAAC CACG CT GAC CT G CT GC GGAAGAAT G CAGAGGT GAC CAAACAG GT GT C CAT GG 1111 

Qy 1553 C CAGACAAGC C CAGGTAGATTT GGAAC GAGAGAAAAAAGAGCT G GAG GATT C GT T G GAG C 1612 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 1112 CCAGACAAGCCCAGGTAGATTTGGAACGAGAGAAAAAAGAGCTGGAGGATTCGTTGGAGC 1171 

Qy 1613 G CAT C AGT GAC C AG G G C C AG C G GAAGAC T C AAGAAC AG CTG G AAGT T C T AG AGAG C T T GA 1672 

I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1172 G CAT CAGT GAC C AG G G C CAG C G GAAGACT CAAGAACAG CT G GAAGTT CTAGAGAG CT T GA 1231 

Qy 1673 AGCAGGAACTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTT 1732 

I I I I II I I I I I I I I I I I I II I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I II 
Db 1232 AGCAGGAACTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGCAAGGCAGCCTGGAAACTT 1291 

Qy 1733 CTGCCCAGTCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGCTAGAGAAGGAGCGGGACA 1792 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1292 CT G C C CAGT CAGAAG CAAACT GG G CAGC C GAGT T C G C C GAG CT AGAGAAG GAG C GGGACA 1351 

Qy 1793 GCCTGGTGAGTGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGC 1852 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1352 GCCTGGTGAGTGGCGCAGCTCATAGGGAGGAGGAATTATCTGCTCTTCGGAAAGAACTGC 1411 

Qy 18 53 AGGACAC T CAG CT CAAACT G GC CAG CACAGAG GAAT CT AT GT G C CAG CT T G C CAAAGAC C 1912 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1412 AG GAC ACT C AG CT C AAAC T G G C CAG CAC AGAG GAAT C T AT GT G C CAG C T T G C CAAAGAC C 1471 

Qy 1913 AACGAAAAATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCC 1972 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1472 AACGAAAAATGCTTCTGGTGGGGTCCAGGAAGGCTGCGGAGCAGGTGATACAAGACGCCC 1531 

Qy 1973 TGAACCAGCTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCT 2032 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1532 TGAACCAGCTTGAAGAACCTCCTCTCATCAGCTGCGCTGGGTCTGCAGATCACCTCCTCT 1591 

Qy 2033 C CAC G GT CAC AT C CAT T T C C AG CT G CAT C GAG C AAC T G GAGAAAAG CT GGAGC C AGT AT C 2 092 

I I I I I I I I I I I I I II I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1592 CCACGGTCACATCCATTTCCAGCTGCATCGAGCAACTGGAGAAAAGCTGGAGCCAGTATC 1651 

Qy 2093 TGGCCTGCCCAGAAGACAT CAGT GGACTTCTCCATT CCAT AAC CCTGCTGGCCCACTTGA 2152 

I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I II 
Db 1652 TGGCCTGCCCAGAAGACATCAGTGGACTTCTCCATTCCATAACCCTGCTGGCCCACTTGA 1711 

Qy 2153 CCAGCGACGCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCG 2212 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I 
Db 1712 CCAGCGACGCCATTGCTCATGGTGCCACCACCTGCCTCAGAGCCCCACCTGAGCCTGCCG 1771 

Qy 2213 ACTCACTGACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCC 2272 



I I I I I I I I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I 

Db 1772 ACTCACTGACCGAGGCCTGTAAGCAGTATGGCAGGGAAACCCTCGCCTACCTGGCCTCCC 1831 

Qy 2273 T GGAGGAAGAGGGAAG C CT T GAGAAT G C C GACAGC ACAG C CAT GAG GAACT G C CT GAGCA 2332 

I I I 1 I I 1 I I ! I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1832 TGGAGGAAGAGGGAAGCCTT GAGAAT GCCGACAGCACAGCCATGAGGAACTGCCT GAGCA 1891 

Qy 2333 AGATCAAGGCCATCGGCGAGGAGCTCCTGCCCAGGGGACTGGACATCAAGCAGGAGGAGC 2392 

I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 1892 AGATCAAG G CCAT C GGC GAGGAG CT C CT GC C CAG G G GACT GGACAT CAAG CAGGAGGAG C 1951 

Qy 2393 TGGGGGACCTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGG 2452 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I 
Db 1952 TGGGGGACCTGGTGGACAAGGAGATGGCGGCCACTTCAGCTGCTATTGAAACTGCCACGG 2011 

Qy 2453 C CAGAATAGAGGAGAT GCT CAGCAAATCCCGAGCAGGAGACACAGGAGT CAAATTGGAGG 2512 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2012 C CAGAATAGAGGAGAT GCT CAGCAAAT CCCGAGCAGGAGACACAGGAGT CAAATT GGAGG 2071 

Qy 2513 TGAATGAAAGGATCCTTGGTTGCTGTACCAGCCTCATGCAAGCTATTCAGGTGCTCATCG 2572 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2 072 TGAATGAAAGGATCCTTGGTT GCT GTACCAGCCT CAT GCAAGCTATTCAGGT GCT CATC G 2131 

Qy 2573 TGGCCTCTAAGGACCTCCAGAGAGAGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTA 2 632 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2132 TGGCCTCTAAGGACCTCCAGAGAGAGATTGTGGAGAGCGGCAGGGGTACAGCATCCCCTA 2191 

Qy 2 633 AAGAGTTTTATGCCAAGAACTCTCGATGGACAGAAGGACTTATCTCAGCCTCCAAGGCTG 2 692 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 

Db 2192 AAGAGTT TT AT GC CAAGAACT CT C GAT G GACAGAAG GACT TAT CT CAG C CT C C AAGG CT G 2251 

Qy 2 693 TGGGCTGGGGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGA 2752 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I 

Db 2252 TGGGCTGGGGAGCCACTGTCATGGTGGATGCAGCTGATCTGGTGGTACAAGGCAGAGGGA 2311 

Qy 2753 AATTTGAGGAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGG 2812 

I I II I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2312 AATTTGAGGAGCTAATGGTGTGTTCTCATGAAATTGCTGCTAGCACAGCCCAGCTTGTGG 2371 

Qy 2813 CT G CAT C CAAG GT GAAAGCT GATAAG GACAGC C C CAAC C TAG C C CAG CT GCAG CAG GC C T 2 872 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2372 CTGCATCCAAGGTGAAAGCTGATAAGGACAGCCCCAACCTAGCCCAGCTGCAGCAGGCCT 24 31 

Qy 2873 CTCGGGGAGTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCAC 2932 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 32 CTCGGGGAGTGAACCAGGCCACTGCCGGCGTTGTGGCCTCAACCATTTCCGGCAAATCAC 24 91 

Qy 2933 AGAT C GAAGAGACAGACAAC AT GGACTT CT CAAG CAT GAC GCT GACAC AGAT CAAAC GC C 2992 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 24 92 AGAT C GAAGAGACAGACAAC AT GGACTT CT CAAG CAT GAC GCT GAC ACAGAT CAAAC G C C 2551 

Qy 2993 AAGAGAT G GAT T C T CAG GT T AG GGT GCTAGAG CTAGAAAAT GAATT GCAGAAG GAGC GT C 3052 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 2552 AAGAGAT GGAT T CT CAG GT TAG GGT G CTAGAG CTAGAAAAT GAAT T G CAGAAG GAG C GT C 2611 

Qy 3053 AAAAACTGGGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGG 3112 

I I I I II I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 



Db 2 612 AAAAACTGGGAGAGCTTCGGAAAAAGCACTACGAGCTTGCTGGTGTTGCTGAGGGCTGGG 2671 

Qy 3113 AAGAAGGAACAGAGGCAT CT C CAC CTACAC T GCAAGAAGT GGTAAC C GAAAAAGAAT AG 3171 

I I I I I I I I I I I I I I I I I I I I I I I I I t I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II 
Db 2672 AAGAAGGAACAGAGGCAT CT C CAC CTACACT GCAAGAAGT GGTAAC C GAAAAAGAATAG 2730 



RESULT 2 
CD251809 
LOCUS 

DEFINITION 

ACCESSION 
VERSION 
KEYWORDS 
SOURCE 

ORGANISM 



REFERENCE 
AUTHORS 
TITLE 
JOURNAL 

COMMENT 



FEATURES 
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CD251809 867 bp mRNA linear EST 22-MAY-2003 

AGENCOURT_14205955 NIH_MGC_180 Homo sapiens cDNA clone 
IMAGE: 30383286 5', mRNA sequence. 
CD251809 

CD251809. 1 GI: 31012275 
EST. 

Homo sapiens (human) 
Homo sapiens 

Eukaryota; Metazoa; Chordata; Craniata; Vertebrata; Euteleostomi ; 

Mammalia; Eutheria; Euarchontoglires ; Primates; Catarrhini; 

Hominidae; Homo. 

1 (bases 1 to 867) 

NIH-MGC http://mgc.nci.nih.gov/. 

National Institutes of Health, Mammalian Gene Collection (MGC) 
Unpublished (1999) 

Contact: Daniela S. Gerhard, Ph.D. 
Office of Cancer Genomics 
National Cancer Institute / NIH 
Bldg. 31 RmlOA07 Bethesda, MD 20892 
Email: cgapbs-r@mail.nih.gov 
Tissue Procurement: Dr. Michael Brownstein 
cDNA Library Preparation: Invitrogen Corp 

cDNA Library Arrayed by: The I.M.A.G.E. Consortium (LLNL) 

DNA Sequencing by: Agencourt Bioscience Corporation 

Clone distribution: MGC clone distribution information can be 

found through the I.M.A.G.E. Consortium/LLNL at: 

http : / / image . llnl . gov 

Plate: NDAM446 row: o column: 07 

High quality sequence start: 3 

High quality sequence stop: 695. 
Location/Qualifiers 
1. .867 

/organism="Homo sapiens" 
/mol_type="mRNA" 
/db_xref="taxon: 9606" 
/clone=" IMAGE: 30383286" 

/lab_host="DH10B-Ton A ( Tl and T5 phage resistances)" 
/clone_lib="NIH_MGC_180" 

/note="0rgan: Testis; Vector: pCMV-SPORT6 . 1 ; Site_l: NotI; 
Site_2: EcoRV (destroyed); Library is oligo-dT primed and 
directionally cloned (EcoRV site is destroyed upon 
cloning). Average insert size 1.68 kb . Library was 
constructed by (Invitrogen) . Note: this is a NIH_MGC 
Library. " 



ORIGIN 



Query Match 17.8%; Score 809; DB 6; Length 867; 

Best Local Similarity 100.0%; Pred. No. 0; 



Matches 809; Conservative 0; Mismatches 0; Indels 0; Gaps 0; 

Qy 1115 GTTCATTCAGCAGT GATCCCTTCAATTT CAACAGTCAAAATGGT GT GAACAAGGAT GAGA 1174 

I I II I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I | | I I I I 
Db 29 GTTCATTCAGCAGT GATCCCTTCAATTT CAACAGTCAAAATGGT GT GAACAAGGAT GAGA 88 

Qy 1175 AGGACCACTTAATT GAGCGACTATACAGAGAGAT CAGT GGATTGAAGGCACAGCTAGAAA 1234 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 89 AG GAC C ACT T AAT T GAGC GACT AT AC AGAGAGAT CAGT GGAT T GAAG GCACAGCTAGAAA 148 

Qy 1235 ACATGAAGACTGAGAGCCAGCGGGTTGTGCTGCAGCTGAAGGGCCACGTCAGCGAGCTGG 1294 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 14 9 ACATGAAGACTGAGAGCCAGCGGGTTGTGCTGCAGCTGAAGGGCCACGTCAGCGAGCTGG 208 

Qy 12 95 AAGCAGATCTGGCCGAGCAGCAGCACCTGCGGCAGCAGGCGGCCGACGACTGTGAATTCC 1354 

I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I II I I I 

Db 209 AAG C AG AT CT GGC C GAGC AG CAG CAC CT GC G GCAG C AG GC G GC C GAC GACT GT GAATT C C 268 

Qy 1355 TGCGGGCAGAACTGGACGAGCTCAGGAGGCAGCGGGAGGACACCGAGAAGGCTCAGCGGA 1414 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I II I 
Db 2 69 TGCGGGCAGAACTGGACGAGCTCAGGAGGCAGCGGGAGGACACCGAGAAGGCTCAGCGGA 328 

Qy 1415 GCCTGTCT G AGAT AG AAAG GAAAGCT C AAG C C AAT GAAC AGC GAT AT AG C AAG C T AAAG G 1474 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 329 GCCTGTCT G AGAT AGAAAG G AAAG CT CAAG C C AAT GAAC AGC GAT ATAG C AAGCTAAAG G 388 

Qy 14 75 AGAAGT AC AGC GAGC T GGT T CAGAAC CAC G C T GAC CTGCTGCG GAAGAAT GCAGAGGT GA 1534 

I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 38 9 AGAAGTACAGCGAGCTGGTTCAGAACCACGCT GAC CTGCTGCGGAAGAAT GCAGAGGT GA 44 8 

Qy 1535 C CAAACAGGT GT C CAT GGC C AGACAAG C C CAG GTAGAT T T G GAAC GAGAGAAAAAAGAGC 1594 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 44 9 C C AAAC AG G T GT C CAT GGC CAG AC AAG C C CAG GTAGAT T T G GAAC GAGAGAAAAAAGAGC 508 

Qy 1595 T G GAG GAT T C GT T G GAG C G CAT CAGT GAC CAG GGC CAGC G GAAGACT CAAGAAC AGCT GG 1654 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 509 T G GAG GATT C GT T GGAG C G CAT CAGT GAC CAG GGC CAG C G GAAGACT CAAGAACAG CT GG 568 

Qy 1655 AAGTTCTAGAGAGCTTGAAGCAGGAACTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGC 1714 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I I I I I I I I 
Db 569 AAGTTCTAGAGAGCTTGAAGCAGGAACTTGCCACAAGCCAACGGGAGCTTCAGGTTCTGC 628 

Qy 1715 AAGGCAGCCTGGAAACTTCTGCCCAGTCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGC 1774 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I II I I I I I I I I I I I I I I I I II I I 
Db 629 AAGGCAGCCTGGAAACTTCTGCCCAGTCAGAAGCAAACTGGGCAGCCGAGTTCGCCGAGC 68 8 

Qy 177 5 TAGAGAAGGAGCGGGACAGCCTGGTGAGTGGCGCAGCTCATAGGGAGGAGGAATTATCTG 1834 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 689 T AGAGAAG GAG C G G GACAG C CT GGT GAGT G G C GCAGCT CATAG G GAG GAGGAAT TAT C T G 74 8 

Qy 1835 CTCTTCGGAAAGAACTGCAGGACACTCAGCTCAAACTGGCCAGCACAGAGGAATCTATGT 1894 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 74 9 CTCTTCGGAAAGAACTGCAGGACACTCAGCTCAAACTGGCCAGCACAGAGGAATCTATGT 808 

Qy 18 95 G C CAG C T T GC C AAAGAC C AAC GAAAAAT G 1923 

I I I I I I I I I I I I I I I I I I I I I I I I I I I I I 
Db 8 09 G C C AG CT T GC C AAAG AC C AAC GAAAAAT G 837 



